开源中国旗下的Gitte未来不只做开源软件托管工具平台,还想做开源AI模型的托管平台。
“本想享受国内互联网高速发展的红利,却错过了风口的窗口期。”作为中国开源软件的第一批布道者,马越自2007年回国创业后几经波折,曾“像噩梦一般”背负高达1.8亿元的债务。
在不懈的坚持下,如今他执掌的“开源中国”已转型为中国开源软件托管工具平台。当“AI的风”刮来,他看到了中国开源AI模型托管平台的新希望。
今年6月,开源中国完成B+轮融资,央企、地方资本、互联网大厂、投资机构重塑了开源中国的股权架构。马越说,“团队拿回公司实控权,再创业看到了新机会、新模式”。
为卸债务、求发展“嫁”给百度
“我那时年少轻狂。”第一财经记者曾于2015年12月采访过马越,他回忆说,那时他回国创立的“恒拓开源”刚刚登陆新三板,他踌躇满志地想把旗下的“开源中国”打造为中国开源软件的“众包”平台,让写软件的程序员们变为自由职业者。
但是,开源软件“众包”平台,吸引来了流量,却没有盈利模式。迫于投资者的压力,开源中国不得不从恒拓开源的上市公司里被剥离出来,自己慢慢孵化。可是,公司亏损逐渐累积。为了维持公司的运转,马越债台高筑,举步维艰。
今年7月再次接受第一财经记者独家采访时,马越自嘲“历经磨难,已深谙世事”。过去16年,他作为中国开源软件产业发展的见证者和参与者,多次“踩坑”,几度转型。
马越早期在美国学习、工作时,是开源软件的受益者。于是在2012年,马越主导恒拓开源收购了开源中国,把它转型为开源软件社区网站。2013年开源中国发布了Gitee工具社区平台,把美国开源软件托管平台Github上的项目“克隆”过来,让国内的程序员下载更快、使用更易。
开源中国转型为工具社区后,黏性更大。至今,Gitee上有超过1200万注册用户,服务超过26万家企业,承载着开源生态基础设施技术底座的角色,有2000万个代码仓,华为、阿里、腾讯、百度等的优秀开源项目都在这里。
2018年,微软以75亿美元全资收购了Github。2019年,百度收购了持有Gitee的开源中国。当时开源中国背负债务,把60%的控股权卖给了百度后,还清了债务。“时也命也运也”,马越说,当时想背靠百度集团来快速发展,但创业总是充满艰辛,新挑战不期而遇。
为转型中立托管平台而“赎身”
2020年是中国开源产业的转折点。当年,中国开源领域首个基金会“开放原子开源基金会”成立,由阿里巴巴、百度、华为、浪潮、360、腾讯等联合发起。它改变了马越的命运。
华为的鸿蒙系统、欧拉系统等都捐给了开放原子开源基金会,这些软件也需要放到一个中立第三方的代码托管开放平台上。开源中国的Gitee平台是不二之选,但此时开源中国是百度集团绝对控股的公司,开源中国再次迎来股权变动的契机。
但是,如果从百度“出来”,开源中国又要重新面对商业模式、如何赢利的问题。“咱咋挣钱形成自己造血的能力呀?公司难以维系、背负高额债务的这种痛苦,人生只能经历一次,像噩梦一样。”马越当时很纠结。
那时Gitee没有商业模式,只有用户与流量,如何商业化?马越发现美国纳斯达克有几家软件工程工具的上市公司,它们的市值合起来有1000亿美元,而国内A股还没有这样的公司。
软件自主可控、国产替代带来了新机会。明确了企业愿景与目标,开源中国进行组织扩张,当年80人的团队,花一年时间就壮大为300人,新招的基本全是研发人员,业务从代码托管延伸到一体化工具。一体化工具,可以帮助企业做软件工程系统,把零碎的软件收到核心代码仓,变为资产。
2020年是开源中国商业化的元年,它转变为一个软件工程工具公司,通过产品销售与技术服务进行商业盈利。马越说,开源中国1200万个人用户服务26万多个小团队,其中有1万个小团队每年支付3000万元,每个小团队一年交3000元服务费;开源中国还开发了大B客户。比如,帮银行、券商把软件“私有化”,把代码放在它们自己的机房,保障信息安全、私域数据运用和软件二次开发,这样的客户一年支付约200万元-700多万元不等的服务费。
这样的商业模式之下,有了新的多元化股东加入。开源中国2022年12月引入了一批新股东,包括中移北京基金、中网投、国调科改、中科创星的“国家队”,上海科创/海望资本、上海国际创投、瑞壹投资、泰达实业、张江科投、浦东软件园的“地方队”,百度、华为、联想的“科技大厂”,以及天际资本、君联资本、容亿资本的“市场资本”。新股东首批3亿元资金去年12月到位,第二批4.75亿元资金今年6月到位,至此开源中国从百度“赎身”出来。
“命运又握在了自己的手里,又要面临不可知的挑战,现在除了IPO也没有别的路了。”马越重新回到了创业的心态。
乘着软件国产化的东风,开源中国自2020年开始“做生意”后,“今年有可能不赔钱了”,马越说,终于有望摆脱一直“烧钱”的历史,2023年开源中国预计营收1.6亿元,实现盈亏平衡。
人工智能大模型要来了,他看到了新的风口。美国一家开源AI模型托管公司Huggingface走出了一条路,它只有100多人、估值已达20亿美元,因为它收录了十几万个开源大模型,还有数据集。马越认为,对企业来讲,只有专属数据训练才有价值,需要把自己的专属数据整理好,然后用一个开源模型来训练,才能得出自己企业的AI模型。在此过程中,开源AI模型托管公司可以分发算力,让企业训练数据的成本降低。
“我们已从Huggingface上复制了5000个模型过来,正在找算力,今年会跑起来。马越说,现在国内科技大厂之间掀起“百模大战”,普通的企业很难得到算力,预计两三年里国内只剩下一两家AI大模型胜出。一些地方政府有算力,希望让更多企业享受AI模型的普惠。
在马越的构想中,Gitte未来不只是开源软件托管工具平台,还可以做开源AI模型的托管平台。阿里最近推出魔搭,国内“百模大战”结果尚未揭晓。“开源是一种商业模式,要的不单是流量,核心生命力在用户反馈和传播。”他说。