文心一言的正式推出,就这么轻易吗?

来源: 芯闻路1号 2023-03-25 00:00:00
艾迪星
Hello,大家好,我是编辑-艾迪星,致力发掘不一样的科技News,欢迎来到我的主页共同探讨最新选题~
相关专题
#AI智能引发的“科技革命”

火的一塌涂地的大算力,算的是什么?

  随着ChatGPT、文心一言的发布,AI绘画再度火出圈。

  过去一周,百度文心一言生成的绘画作品在网上遭遇“群嘲”,原因在于其绘画功能对中文成语的理解仅停留在字面意思,如网友输入“夫妻肺片”后文心一言生成了一对夫妻以肺部的排列面面相觑地出现,输入“鱼香肉丝”,文心一言给出了一条由肉丝做成的鱼,实在是令密集恐惧症患者难以直视,输入“胸有成竹的男人”则画出一个胸部长出竹子的人……

  但其实从4月份OpenAI发布的Dall-E2,就也存在“仅停留在表面含义”的生成问题。但Dall-E有一个好处就是,它对绘画风格的模仿非常精准。OpenAI曾经让Dall-E2仿照一些画家的风格生成了一批图片,然后将这些图片和画家本人绘制的图放在一起让用户来进行分辨。结果显示,大部分的用户根本无法判断哪些图是原画,哪一些图是由AI生成的。

  其实,DALL-E从根本上讲,还是在模仿人类。该模型由神经网络支持,而主要的算法就是模仿人脑工作。

  而现在这些智能化程序在在“智慧能力”提升之外,多种数据训练而成的“大模型”在应用落地和商业化上也有着自己的先天优势。不同于过去人工智能的“孤岛式”落地发展,每一个大模型都拥有可以对应广阔的应用场景,在新应用场景落地的同时,还会给大模型本身带来更多的原始数据,反过来不断扩展大模型的智慧能力边界。

   

自主学习还是被动式学习?

  这类生成式AI程序通过分析图像以及人们输入的文字,来“了解”对象,以及这些对象之间的关联。

  DALL-E的产品经理Joanne Jang举了这么个例子:“如果DALL-E看到了很多考拉的照片,而这些照片的标题就是考拉,那么这个模型就会知道考拉长什么样子。而如果输入的是考拉骑摩托车,那么DALL-E就会结合它自己对考拉、摩托车,以及骑行的概念来对这三者之间的关系进行解释。”

  但也同时根据众多网友的实测,有时候生成的图片,对于人类来说很简单就联系起来的情境,在DALL-E生产出来之后就变得扭曲或过于抽象。

  而目前据一些网友反馈,生成式AI模型如DALL-E 2这类图片生成模型其实仍被数据库所限制,因为库内数据的权重不同,输出的作品也仅仅建立在已有的资源中。但对于还在学习的AI大数据模型来说,不论数据有多么充实,它的学习框架始终都会处于一个有待优化的阶段,仍需通过作者的不断调整才能生出令人满意的答卷。 

  而ChatGPT从表面来说,ChatGPT就是一个自动回复的聊天机器人,用户只需要在对话框中键入相关内容,ChatGPT就会给出回应。但和之前的对话机器人相比,ChatGPT的能力显然要强大太多。它不仅可以根据交互过程中的上下文,对用户的一些简单问题对答如流,还可以按照用户指示完成较为复杂的工作。

  他就像一个包容度极强的付费版电子老师,不管你提出的元素多么琐碎,他也会颇有耐心的综合语言来回应你。同样,出品于OpenAI。

   

大步前行,要有前驱者   

  话说回来,饱受吐槽的文心一言实则是第一个敢吃螃蟹的的“人”,直接杀出中国市场第一线。作为百度“出山大弟子”,基于百度新一代大语言模型的生成式AI产品,“文心一言”于3月17日正式面世,官方展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。正式版将于3月27日正式推出。

  但根据一些网友实测反馈,部分回答与生成图片令人有些尴尬。不过技术的问题是普通用户比较难理解,毕竟一个新鲜事物的成长必然要经历一个过程,这是一件自然而然的事。但正如时代的更新迭代,千禧年的时候,大家可没有觉得大哥大或者小灵通功能少、外观土。消费者与产品总会经历一个磨合的过程。

  企业在推出一个产品时,肯定主要是基于技术和需求方面的考虑。当国外的ChatGPT兴起,中国企业自然不会视而不见,百度推出文心一言,多少也会带着某种使命感去做这样尚未出现领头羊的国产项目。但切实地,用户是否也会对这种使命感产生共情呢,恐怕就难以言说了。  

  作为一个消费者,可能更看重的还是产品本身的价值,如果产品好,自然会去使用,如果还不够好,可能暂时就会放弃。观望观望,是普遍行业中会出现的现象。

 

李彦宏也直接坦言了,产品不完美,但是有市场需求。

  在百度生成式AI产品“文心一言”发布之际,百度提升了三大配套云服务,对企业快速布局、应用生成式AI产品搭载了助推器,有望看到生成式AI在更广泛的领域迸发更多的应用场景,促进AI产业普惠罗普大众。

  其背后的训练数据就包括了万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱。这些庞杂知识的共同训练,最终为“文心一言”贡献了思维链和复杂推理能力,让解答各种各样的疑难问题成为现实。

  算力对于百度来说也同样重要。

      目前,百度拥有的AI技术可以分为四个部分,昆仑芯的芯片、飞桨的框架、文心的模型和应用。这次文心大模型背后的硬件算力,是通过百度智能云提供服务的。据百度智能云方面透露,文心一言背后的算力基础设施均由百度智算中心支持,后续百度多个智算中心也将为文心一言面向产业的规模化落地提供底层支撑。

  之所以软硬件都要布局,百度称是为了降低成本:生成式AI需求的算力非常高,费用相当昂贵。因此,如果在四层架构之间相互进行协同优化,就能让它的效率更高,从而显著降低成本。李彦宏也指出这正是百度的优势所在。 

  而后期是否也能像OpenAI一样推出引入插件等延伸发展呢?虽然目前这些 ChatGPT 插件目前尚处于 Alpha 测试阶段,后续将进一步向终端 API 用户开放访问。相信离成功链接并不远了,而文心一言又将用多快的速度追赶上呢,实在是值得期待。

 

0
收藏
0