页首

利用 LLM 和生成式人工智能实现机器人技术的未来

已更新:2023 年 10 月 2 日

在生成式人工智能(GenAI)领域,我们目前正目睹着惊人的发展速度,这并不令人感到完全意外。自计算器发明以来,我们一直在朝着创造更多智能机器的方向稳步前进,虽然最近的 GenAI 突破看似突然,但它们代表了一个循序渐进、艰苦历程的顶峰。


大型语言模型 (LLM),与以 OpenAI 的以 OpenAI 的 ChatGPT 为代表的大型语言模型标志着人工智能进化道路上的最新里程碑。这些 LLMs 已经到了一个类似于 1993 年互联网向大众普及的关头,准备彻底改变人类社会的方方面面,从我们的专业工作到我们彼此之间以及与机器之间的互动。


那么,这些最新的法律硕士进展对机器人世界意味着什么呢?

要了解 ChatGPT 等 LLM 的全部意义,就必须深入研究其机制。LLMs 利用自然语言处理 (NLP) 技术来生成类似人类的反应,并因此而闻名于世。从本质上讲,LLMs 是在互联网等庞大的数据集上进行训练,并采用机器学习算法网络来模拟人脑的运作和信息存储。在这个广阔的框架内,NLP 算法和模型使 LLM 能够以类似人类的方式理解和使用语言。




虽然像 ChatGPT 这样的 LLM 的内部运作涉及众多层面和错综复杂的问题,但它们像人类一样交流的能力尤为关键。这种能力使人工智能的分析和生成能力平民化,通过简单的语言实现人与机器之间的无缝交流。


建立在 LLM 基础上的 GenAI 工具现在如雨后春笋般涌现,这一点也不足为奇。LLM 使人类与机器的交流变得可行,就像人与人之间的交流一样毫不费力,从而为人工智能提供了新的可访问性。我们现在可以说同一种语言了。


然而,这又把我们带回了机器人领域。GenAI 的普及,再加上 LLM 的进步,是否将机器人的普及范围扩大到研究和计算机科学之外?这是否预示着机器人在社会中广泛应用的曙光?

将 ChatGPT 与 Misty 整合在一起 微软技术中心与 Misty 的集成。


事实上,像 ChatGPT 这样的 LLM 使机器人(如 Misty 和 Furhat 机器人)的自主性大大提高。交互不再需要开发人员精心编写脚本和设计,机器人就能与人进行流畅的对话。有了 ChatGPT、Bard 或任何其他人工智能聊天机器人,机器人可以被放置在任何地方,就无数话题进行类似人类的对话。即使是那些缺乏编程专业知识的人,现在也可以享受一个能够进行有意义互动的功能性机器人。这一发展改变了游戏规则,使机器人对更广泛的人群更具吸引力,并有可能加速其广泛融入社会。


不过,我们必须认识到,机器人与单纯的聊天机器人或虚拟化身有很大不同。作为化身代理,尤其是像 Misty 这样的机器人,它们必须拥有比目前的人工智能聊天机器人更广泛的技能。


除了对问题或提示做出回应之外,社交机器人还必须善于做出手势并解读他人的手势。它必须传递情感,听起来真正像人,不仅在声音上,而且在说话方式上,包括停顿、"啊哈 "或 "嗯 "等插话,以及适当的点头和眼神交流。这些非语言行为统称为 "反向交流"(backchanneling),在确保与机器人的互动感觉自然、引人入胜方面发挥着至关重要的作用。

在以下地点启用了 Misty (AIleen) 的 ChatGPT 功能 Twilio 信号 2023

如果机器人在回答问题时目不转睛地盯着地面、过度眨眼或不停点头,那么聊天机器人的回答再出色也无济于事。在人机交互领域,将人机交互与人工智能聊天机器人整合在一起无疑会增强对话的自主性。但是,这种自主性必须辅以熟练的反向对话,才能实现真正的人机交互。在根据口语交互数据对 LLM 进行训练,使其自动生成反向信道行为之前,它们在社交机器人交互中的能力将受到限制。


尽管如此,不可否认的是,目前人工智能聊天机器人的迭代加快并简化了机器人技能的开发,这是前所未有的。虽然未来还有很多工作要做,但毫无疑问,对于像我们这样的机器人公司来说,这是一个异常激动人心的时代。我们正在进入一个阶段,在这个阶段里,各个领域涌现出的众多人工智能公司将探索人工智能与人类和世界互动的新方式。机器人是自然而然的选择,因为它们为人工智能提供了与世界更具体、更直接的联系,是实现更高水平的智能和理解力的关键一步。


总之,机器人现在已经准备好成为真正的社会代理,通过对肢体语言、面部表情和社会细微差别的理解,将 LLM 和 NLP 提升到前所未有的高度。为人工智能提供这种多维体验的前景确实令人兴奋,我们已做好充分准备去实现这一目标。

109 次浏览0 条评论
页底