2022年火爆的AIGC还在谈“文生图”,2023年ChatGPT却一路“狂飙”,弯道超车。
从去年11月,OpenAI发布ChatGPT,这一杀手级应用立马就成为了众人茶余饭后讨论的话题,并在2个月内达到了1亿月活用户,成为了史上增长最快的消费者应用。
微软将通过集成ChatGPT,为Bing搜索带来“革命性”改进;谷歌优化其搜索引擎,发布新的AI工具。与此同时,国内也开始支持 ChatGPT 类大模型的研究。
阿里、腾讯、京东、网易、小米等大厂均已涉足类似ChatGPT和AIGC项目。百度“类ChatGPT应用”文心一言将于三月份完成内测;字节跳动的人工智能实验室(AI Lab)有开展类似ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持。由此,正式掀起了一场AI大模型的“军备竞赛”。
1
国内资本聚焦ChatGPT?
大厂涌动,资本也跃跃欲试。2月10日,美团联合创始人王慧文在朋友圈高调发声,表示愿意带资 5000 万美元(约合人民币 3.4 亿元)入组并进军人工智能,以打造中国版 OpenAI 和 ChatGPT。众多投资机构挑灯夜读,短时间内就对硅谷等地AIGC早期项目的发展了若指掌,希冀以这样的分析为蓝图,寻找中国市场之中的对标企业。
但事情并没有那么简单。
在AIGC行业,通常依据内容的输入和输出形式,将行业分为以文生文、以文生图等垂直赛道。图和文的AI内容生成所依赖的底层技术有所不同,造成二者之间在投资逻辑中存在差异性。
从研发的资金上来看,OpenAI成立于2015年,从可以查到的融资纪录看,2016年-2022年,OpenAI的融资额可能超过30亿美元。
与多数创业公司一样,OpenAI在这些年中不太赚钱,甚至一开始完全是以非盈利机构的身份在开展AI研究。同时,OpenAI在研发方面还持续烧钱。有统计显示,GPT-3的一次模型训练费用可能超过百万美元,上线之后的ChatGPT每天回答问题的成本也是百万美元规模。
要在短时间内,用有限的资金复制OpenAI的成功恐怕并不容易。即便是资金量够大,类“ChatGPT”的大模型还需要丰富的对自然语言文字处理的经验,以及大量的数据,相关的算法,国内真正能做的科技玩家并不多。
从资本市场角度看,中国二级市场注意到ChatGPT的速度已经比一级市场和整个AI圈子晚了2个月。
技术方面,OpenAI在2015年成立,谷歌在2017年发布Transformer,2018年OpenAI推出了GPT的第一个版本,2022年底,现在的ChatGPT才第一次上线。即使一家公司已经具备了OpenAI在2020年推出的大模型GPT-3的水平,现在开始也要3年的时间才能追上ChatGPT。
现在再开始做大模型的创业,或许已经有些晚了。360创始人周鸿祎的看法是,那些此前根本没有大数据存储和能力的公司却宣称要做ChatGPT,几乎就是在蹭热度。他指出,虽然很多公司都宣称要做ChatGPT,但并不是人人都能搭上这班车:“OpenAI背后有微软,谷歌、百度对ChatGPT响应积极,也是因为有搜索引擎业务的支撑,以及背后的服务器集群。这些都是ChatGPT大模型的必备基础”。
而对于VC和创业者们来说,基于ChatGPT类的大模型产品做上层应用、基于平台的SaaS服务、大模型应用的外延拓展以及API调用等,或许可以给新的AI创业公司提供方向。
但在经过将近两个月的持续追捧、尤其是谷歌在2月9日对其人工智能聊天机器人Bard(作为ChatGPT的竞品)进行功能演示时出错导致市值一度蒸发1000多亿美元(约合6800亿元人民币)后,动辄百万美金的门槛,也理应更加“谨慎”一些。
2
投资人转向“文生图”
前面提到,图和文的AI内容生成所依赖的底层技术有所不同,造成二者之间在投资逻辑中存在差异性。
不仅是人类各名族语言文化远比图片类艺术更加复杂,应用领域对AI文生文出现失误的容忍度,也会导致“文生文”领域想要真正实现广泛应用的难度,非文生图可比。更重要的是,国内外还没有很开放的文字大模型给到创业企业,这会延迟AI模型的推出。“类ChatGPT”的机会又被某些大厂作为主要战略,进一步降低了投资人们对该赛道的预期。
而图生图领域,却在去年8月诞生了Stable Diffusion。秉承“大开源”的精神和宗旨,SD不仅在短短两个月时间内让其背后公司实体一跃成为市值高达十几亿美金的独角兽,更吸引了全球数百万乃至上千万人积极参与其生态的建设。
所谓的“大开源”,包括开放核心 AI 算法模型(Latent)、开放核心训练数据集(LAION)、开放 AI 生成图片的版权(CC0)。这种三位一体的开源模式,让全世界所有普通人、极客、创业者、商业团体可以随心所欲地完成对 SD 的部署、运行、改进和商业化,且大胆使用全世界人利用 SD 所无私贡献的 AI 生成式图片,而不必受制于版权的束缚,大胆地去创新,让 AI 技术在视觉生成领域能够零摩擦地大跨步向前,不必受制于商业的条条框框而固步自封。
以此为基础,国内文生图行业的数据训练较文生文有了很大改观。一方面,创新企业有了底层模型支持;另一方面这种模型可在消费级GPU上运行,极大降低了研发成本、提高了产品推向市场的速度。
从NovelAI到ControlNet ……SD的逻辑,给了AIGC行业创业者和VC一个机会。
目前阶段,AI作画可以在三个领域发挥提升生产力的显著作用:
一是艺术生成,既可以让C端用户来生成绘画作品,也可以为游戏工作室、创意机构等生成服装纹理等艺术。
二是广告创意,也称为“甲方终结者”,通过自动化生成和设计创意草图,减少设计师与客户的沟通成本,快速明确设计需求,避免大量反复甚至返工。
三是专业设计,将AI作画与专业领域的知识相结合,如3D建模、建筑设计、医疗、工业设计等,从而减少这些专业领域制造效果图的繁重成本,先由AI根据提示制作粗略的草图,再由专业人员完成后续工作。
而针对有望规模应用的典型场景,我们会发现三波力量,它们的商业化情况是各不相同的。
一是研究机构及其衍生公司,如OpenAI(GPT-3、ChatGPT、DALLE等)这样的非营利性研究机构,或是中科院自动化所(紫东太初大模型)这样的科研院所。后续可能像云服务商一样,采用按量或按需付费来提供服务。
二是大型科技企业。如谷歌、Meta、百度、腾讯、华为等企业都在积极投入,重点关注通用类生成模型领域。
第三就是大量的中小和初创企业。不是所有企业都需要自己训练和开发AIGC大模型,毕竟一家科技巨头也不可能通吃所有算法模型。随着上述两类组织将基础模型和资源开放出来(比如SD正在做的),AI作画的部署成本逐渐降低,大量中小企业和初创团队可以在通用大模型的基础上,探索新的商业模式、产品或服务,形成单一平台/模型+大量企业+无数开发者的AI软件生态。
这类企业容易产出明星应用,比如前不久的意间AI绘画小程序。但ToC应用的核心挑战是使用场景单一,一旦用户兴趣退潮,拉新和运营成本会陡然增长,产品必须重新探索增长方式。
另一个可能率先火热起来的市场则是企业服务,与垂直行业相结合,基于基础模型形成标准化程度高、成本与回馈模型成熟的ToB垂类解决方案。比如无界AI的图像生成模型,对于艺术创作、设计等工作的生产力提升是非常可观的,同时对于国风的理解非常深刻。我们在年前推出了专业级别的AI绘画工具,在原本能将需要数天甚至数周才能完成的画作实现一秒完成的基础上,实现了模型调教功能,已经具备了“抢人类设计师饭碗”的基础条件。
而自AI绘画诞生以来,就从未停止过争议的版权问题,目前虽然还没有明确的共识和定义,但随着应用落地的进程的加速,也未必不可能在2023年通过行业标准、规范与共识而带来改变。
2023,将成为AIGC的发展大年。
参考文章:
ChatGPT热度再升级,AIGC的投资人开始关注“文生图”了:https://baijiahao.baidu.com/s?id=1757879512445051990&wfr=spider&for=pc
王慧文2亿美金撬动中国版OpenAI的计划,有退路吗?:https://www.huxiu.com/article/794637.html
ChatGPT持续“高烧”,再走一遍元宇宙的老路:https://www.jiemian.com/article/8904916.html
2023,AIGC能赚到钱吗?:https://www.woshipm.com/it/5712689.html