(资料图片)
快速成长中的大语言模型功能日新月异。为解决复杂问题,它甚至可以调用工具,“自动”写代码进行编程!
近日,上海人工智能实验室推出书生·浦语大语言模型的升级版对话模型InternLM-Chat-7B v1.1(以下简称“InternLM-Chat”)。InternLM-Chat为首个具有代码解释能力的开源对话模型,能够根据需要灵活调用Python解释器等外部工具,在解决复杂数学计算等任务上的能力显著提升;此外,该模型还可通过搜索引擎获取实时信息,提供具有时效性的回答。
当前,大多数开源模型主要聚焦于对话主观体验的提升,并不具备良好的调用外部插件的能力。“大语言模型虽然在对话能力上表现出色,但是在数学计算等复杂场景下,依然具有一定的局限性。”科研人员举例说,“模型虽然可以完成小数字的基本运算,但是难以进行大数运算。”此时,如果有代码解释器或者计算器等工具进行辅助,就能够比较方便地解决这类问题。针对此情况,书生·浦语团队进行了积极研究探索,赋予了InternLM-Chat调用代码解释器、检索工具等外部插件的新能力。
“面对解方程等复杂的数学计算问题,模型仅凭自身能力难以完全做对,而有了代码解释器的加持,模型只要能写对方程式,就可调动代码解释器完成方程求解。”上海人工智能实验室科研人员表示。
此外,由于大语言模型迭代周期较长,往往难以获取最新的知识,调用检索工具则可以显著地增强模型对最新知识的获取和了解,提高回答的时效性和有效性。例如,向新版大模型询问“LK-99真的是常温常压超导体吗”,此时大模型会先搜索“LK-99常温超导体”,并检索到三篇参考资料,在阅读这些资料内容后,给出总结回答“LK-99并没有被证实为常温常压超导体”。
记者获悉,书生·浦语团队还将最新研究成果运用于书生·浦语千亿参数版本大语言模型的能力提升中,使其实现了在复杂场景中进行多步推理和计算。目前,书生·浦语千亿参数版本大语言模型已拥有多知识点运用、自主反思及修正错误等能力,模型的推理能力和插件调用能力也日渐提升。
新民晚报记者 郜阳
关键词: