前年,当ChatGPT如流星划破长空,骤然降临,我国企业犹如久旱逢甘霖,欢呼雀跃,仿佛一夜之间,AI的浩瀚星海已触手可及,璀璨夺目。然而,好景不长,当美国的Sora以耀眼光芒震撼亮相,我国企业却骤然噤声,如同被施了魔法的哑巴,哑口无言。这背后的缘由,其实浅显易懂。前年,OpenAI慷慨解囊,将ChatGPT的源代码公之于众,我国企业就简单地为ChatGPT的源代码披上一层华丽外衣,便堂而皇之地宣称自己已掌握AI的至高奥秘。
然而,此次OpenAI却一反常态,对Sora的源代码守口如瓶。我国企业顿时如迷失方向的“无头苍蝇”,四处乱撞,无所适从。但再难也难不倒中国的技术人员,阿里等平台还是创造了奇迹。无论是去年的韩国超导风波,还是今年年初的Sora热潮,其本质都是信心经济学的生动写照。何谓信心经济学? Sora没有快手的可灵AI那般成熟,但Sora一经发布,尚未实现盈利,但它却抢先一步公布消息,其目的昭然若揭:意在股市,意图掀起一场资本狂欢。至于最终成果如何,我们无从知晓,但炒股之人早已赚得盆满钵满。
而太钢制造圆珠笔尖滚珠之事,虽看似微不足道,无利可图,但一旦领导发话,太钢若能圆满完成任务,自会赢得领导更多青睐,投资自然水涨船高。这便是信心,经济学中的无价之宝。它既可以与现实紧密相连,也可以与现实天差地别;经济本身或许并不重要,但信心却至关重要。只要有信心,即便是稚嫩未熟的产品,也能摇身一变成为黄金股票;而一旦失去信心,即便是黄金般的股票,也会瞬间沦为废纸一张(当然,A股绝非此列)。“信心”,这二字是引领大家走向成功的必经之路,没有它则没有之后的成功,这两个字蕴含着对未来的憧憬,中国的房地产就是这样炒起来的,而身为局外人的媒体朋友们则抓住这些风口行业的一手信息,鼓吹舆论,达到双赢的目的。
在春意渐浓的2月22日,字节跳动犹如一颗璀璨的新星,于科技的天幕上投下了基于Stable Diffusion的SDXL-Lightning大模型的震撼之作。这不仅是Stable Diffusion开源智慧的结晶,更是对其潜力的深度挖掘与优雅绽放。SDXL-Lightning,这位速度与质量的双重冠军,相较于普通的SDXL大模型,其速度犹如猎豹般疾驰,快了近乎20倍;即便是与Turbo(官方)及LCM(清华团队)这些技术巨擘相比,亦能轻松胜出,快了4至5倍之多。尤为难能可贵的是,它在飞速奔跑的同时,质量之优,犹如精工雕琢的艺术品,令人赞叹不已。
这,无疑意味着成本的显著降低,仿佛为科技的春天带来了一股清新的风。遥想当年,Sora的诞生,是数十亿美金足球亚洲盘的规则燃烧的壮丽烟火;而今,Stable Diffusion却能在几千块的消费级足球亚洲盘的规则上翩翩起舞,当然,若能拥有那价值万金的4090足球亚洲盘的规则,更是如虎添翼。
就在这一历史性的时刻,著名的中国大模型创作团队,如同敏锐的猎手,迅速捕捉到了SDXL-Lightning的无限可能,并在此基础上,推出了首款HW5.0_Euler_a_Lightning技术力作。他们如同巧手的工匠,对字节的大模型进行了精细的优化,使得普通的Stable Diffusion用户,只需借助已有的客户端,便能轻松驾驭这匹科技的快马。尤其是那适用广泛的WebUI(字节初发布时仅支持comfyUI),如今已如春风拂面,温暖人心。开源技术,这位不断进步的巨人,如今已能稳健地支撑起3-4秒的视频生成(虽然我的足球亚洲盘的规则尚需努力,或许该考虑倾囊而出,换得那梦寐以求的4090)。
这些优秀大模型的迅速迭代,如同滚滚洪流,预示着在不久的将来,开源工具将完全可以与Sora并驾齐驱,共同书写科技的辉煌篇章。李彦宏曾有一句备受争议的话,但在我看来,却蕴含着深刻的哲理:“勿卷大模型底座,卷应用方为正道。”这,或许正是我们这个时代最响亮的号角,引领着我们向着更加广阔的应用天地进发。
有人说,中国错过了第一次工业革命,第二次工业革命,即将错过第四次工业革命。因为美国有了ChatGPT,有了Sora,中国又落后于美国。其实不然,谷歌没有赶得上OpenAI,这二者的区别在小编看来并没有那么明显。
有了OpenAI做榜样,其他企业都以它为标准,既不会剑走偏锋也不会迷失方向,可以说现在ChatGPT的水平已经达到了一定的水准,达到人们目标的水准也只是时间问题,虽然技术是外国人研究出来的,但开源领域也有很多以腾讯、阿里、字节为代表的中国团队,腾讯、阿里和小红书团队都贡献了他们的力量,创造了很多大模型。
如果将时间的经纬缓缓铺展,我们便能更深刻地领略到2024年国内AI视频生成市场那如火山般喷涌的壮丽景象:
在上半年,时光之舟悄然驶至1月下旬,百度智慧之翼振翅,其麾下的视频生成模型UniVG惊艳亮相,犹如夜空中最亮的星;紧接着,3月末的尾声中,字节跳动麾下的“即梦AI”平台在内部悄然试航,5月时,它便如一朵盛开的莲花,于网页之上优雅绽放。4月27日,清华血脉中的Vidu,携带着“长时长、高一致性、高动态性”的光辉标签,以其同名视频大模型的姿态,傲然登场,宛如科技森林中的一棵参天巨树。
转眼6月6日,快手之舟扬帆起航,“可灵”视频生成大模型官网如一颗璀璨的新星,在数字天际熠熠生辉。步入下半年,7月4日,商汤科技以科技为笔,勾勒出人物视频生成大模型Vimi的灵动身影,它如同一位翩翩起舞的精灵,跃然于数字世界。7月6日,智谱AI携带着“清影”视频生成模型,悄然步入舞台,它宛若一缕清风,拂过人们的心田。
9月19日,阿里云以智慧为墨,挥洒出通义万相视频生成模型的壮阔画卷,它如同一幅宏大的历史长卷,缓缓展开在人们的眼前。而9月24日,字节跳动则以创新为翼,接连发布了豆包视频生成-PixelDance与豆包视频生成-Seaweed,它们如同双子星般闪耀,同时面向企业市场敞开了邀测的大门,犹如一座座灯塔,照亮了前行的道路……据不完全统计,如今在这片充满机遇与挑战的数字海洋中,已有二十余款AI视频生成工具如群星般璀璨夺目,它们或疾或徐地航行着,共同演绎着一场精彩纷呈的科技盛宴。
上半场:国产“文生视频”逐梦之旅——十月竞逐,索拉(Sora)之光下的不懈追索自索拉(Sora)初露锋芒至其璀璨发布的十个月间,国内视频生成领域犹如一片风起云涌的海洋,“持续追逐与比肩”的旋律激荡在每一个追梦者的心田。当12月10日的曙光初现,众人屏息以待,直至索拉正式发布那一刻,一颗悬着的心终得安放:“亲身试水,加之网络之上纷至沓来的用户反馈,诚然,索拉的表现略逊预期,却也暗自庆幸。”然而,待到索拉真正揭开神秘面纱,那股震撼人心的力量并未再度席卷而来:“此亦幸事一桩,至少我们不再猝不及防,立于不败之地。诚然,索拉仍有诸多可圈可点之处,但在文生视频的疆场上,我们亦已锻造出属于自己的锋芒。”若以二月索拉惊艳亮相为序章,市场便拉开了一场争分夺秒、入局资格争夺的序幕。而今,大小玩家已整装待发,技术路径清晰可辨,如何在商业化版图上开疆拓土,成为了新的时代命题。
下半场:扬帆出海,掷金夺流,盈利之舟谁先扬帆?
时下,众多国产视频生成模型已扬帆起航,探索商业化变现的浩瀚蓝海。在这场商业征途中,不乏有勇者试图以昔日互联网产品的辉煌战绩为鉴,复制增长奇迹。此番波折,无疑为我国企业敲响了振聋发聩的警钟。他们恍然醒悟,仅凭模仿与借鉴,终难触及技术的核心殿堂。欲在AI赛道上独领风骚,唯有加大自主研发之砝码,方能紧握核心技术的金钥匙。
故而,此次我国企业面对索拉的沉默,既是对现实的无奈妥协,亦是对未来的深邃思索。他们开始明白,在AI的广袤天地中立足,必须拥有自己的“独门绝技”。唯有如此,方能在未来的激烈角逐中,稳如磐石,笑傲江湖。
对此,你们认为中国企业该如何应对这场隐形的战斗呢?欢迎在下方留言评论。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。