返回

第43章 又双叒叕突破啦

首页
关灯
护眼
字:
上一章 回目录 下一页 进书架
最新网址:m.feishuwx.net
    第43章 又双叒叕突破啦 (第1/3页)

    孟繁岐的这番话,听起来让人觉得不是那么舒服。

    言下之意,给人一种华国AI技术就是不如国外的感觉。

    这是李彦弘不大喜欢的,毕竟他这么早就关注AI技术,就是为了研发最前沿最先进的技术。

    孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量发表的AI论文所迷惑。

    觉得在这个新崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。

    虽然AlphaGO震惊了世人,但毕竟有些华而不实。

    直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。

    实际上,并非是技术手段和算法层面上相差太远。

    更多的还是因为优质数据的数量不足。

    白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。

    很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。

    文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。

    可见即便不是全部,文心一言这个所谓的专注中文的超级大模型,也在相当程度上借助了英文基础的模型权重和技术。

    究竟为何要这么做,说到底还是基础不够扎实牢靠。

    整理数据,清洗数据,给数据打上高质量的标签。

    这些都是脏活累活,见效慢的工作。

    把别人公开的数据拿过来跑一跑训一训,多么方便快捷?

    以国内996大厂的内卷风气,很难容下长回报周期的基础建设。

    早些时候看看不出区别,只觉得国内大厂频繁在XX榜单上露面,刷榜,又是超过这个,又是超过那个。

    直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。

    “其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐

    (本章未完,请点击下一页继续阅读)
最新网址:m.feishuwx.net
上一章 回目录 下一页 存书签