专为Excel而生的大模型来了!
另一位写道,“SaaS陷入了深深的麻烦。”
“这对金融界来说将产生巨大影响”
宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克(Ethan Mollick)在推特上写道:“这再次表明 LLM 很快就能处理结构化和非结构化电子表格数据。这将解锁许多用例(预测、财务、估值等),并且拥有电子表格真实来源往往会减少幻觉。”
SpreadsheetLLM如何工作?SpreadsheetLLM通过将电子表格数据编码为大型语言模型(LLM)可以理解的格式,从而使LLM能够对电子表格数据进行推理、回答有关数据的问题,甚至根据自然语言提示生成新的电子表格。SpreadsheetLLM的核心是“SheetCompressor”框架,该框架可以有效地压缩和编码电子表格数据,使其更易于LLM处理。SheetCompressor由三个模块组成:▲基于结构锚点的压缩:在整个电子表格中放置“结构锚点”,以帮助LLM理解数据结构。▲逆索引翻译:将电子表格转换为更紧凑的格式,并消除冗余数据。▲数据格式感知聚合:根据数字格式和数据类型对相邻单元格进行分组。
SHEETCOMPRESSOR 框架的插图(图片:Microsoft)
Microsoft称,SpreadsheetLLM显着提高了电子表格检测任务的性能,在 GPT4 的上下文学习设置中比普通方法高出 25.6%,使用词元(token)的成本降低了 96%,并能提供更好的处理结果。目前,Microsoft还没有公布何时向公众发布SpreadsheetLLM 的消息。该论文指出,该模型仍有一些限制,如对于复杂或结构化程度高的数据,其理解能力仍然有限;SheetCompressor目前还不能压缩包含自然语言的单元格等等。⭐星标华尔街见闻,好内容不错过⭐本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。