专为 Excel 而生！微软推出新 AI 模型，网友：会计师和数据分析师，危？

ChatGPT与Excel 1年前 (2024) lida

50 0 0

整理 | 郑丽媛出品 | CSDN（ID：CSDNnews）

继作家、画家、程序员担忧被 AI 取代后，微软近日最新推出的一个新的 AI 模型，可能会让会计师和数据分析师也开始感到紧张了。

上周末，微软在 arXiv 上悄然发表了一篇题为“SpreadsheetLLM: Encoding Spreadsheet for Large Language Models”的研究论文，首次揭示了 SpreadsheetLLM 的相关细节：这个新模型“在各种电子表格任务中都非常有效”，甚至“有可能改变电子表格数据管理和分析的方式”。

专为 Excel 而生！微软推出新 AI 模型，网友：会计师和数据分析师，危？

在论文中，研究人员首先强调了电子表格在商业世界中的普遍性和重要性，指出电子表格被广泛用于各种任务，从简单的数据录入和分析，到复杂的财务建模和决策。然而，由于“广泛的二维网格、各种布局和多种格式选项”，导致现有的大型语言模型（LLM）很难理解电子表格的内容并对其进行推理。

为此，微软推出了 SpreadsheetLLM，想要“开创一种高效的编码方法，以此释放和优化 LLM 在电子表格上强大的理解和推理能力”。

最初，微软研究团队采用了一种原始的序列化方法，整合了单元格的地址、值以及格式信息。但是这种方法受限于 LLMs 的 token 限制，对大多数应用来说并不实用。为了解决这一难题，微软开发了一种创新的编码框架 SheetCompressor，它能够有效压缩电子表格，使其更加适配 LLM 的处理需求。

专为 Excel 而生！微软推出新 AI 模型，网友：会计师和数据分析师，危？

（SheetCompressor 框架示意图）

从框架图中可以看出，SheetCompressor 框架由三个核心模块组成：

基于结构锚点的压缩：在整个电子表格中放置“结构锚点”，帮助 LLM 理解数据结构。

反向索引转换：把电子表格转换为更紧凑的格式，并消除冗余数据。

数据格式感知聚合：根据数字格式和数据类型，对相邻单元格进行分组。

微软表示，在电子表格检测任务中，SheetCompressor 大幅提升了处理速度和准确率：相较于原始的序列化方法，在 GPT-4 的上下文学习环境下，性能提升了 25.6%。此外，经过 SheetCompressor 微调的 LLM，即使平均压缩比例高达 25 倍，但 F1 得分（一种衡量二分类模型精确度的指标）仍能达到业界领先的 78.9%，超越同类模型 12.3%。更值得一提的是，在对各种 LLM 进行“全面评估”后，微软发现 SheetCompressor 可将电子表格编码的 token 使用量大幅减少 96%。

不过，微软也承认目前 SpreadsheetLLM 模型仍有一些限制，如无法很好理解复杂或结构化程度较高的数据，以及不能压缩包含自然语言的单元格等。

但总体来说，展望未来 SpreadsheetLLM 能让更多用户更容易访问和理解电子表格数据，还能帮助自动化许多与电子表格数据分析相关的繁琐耗时的任务，如数据清理、格式化和汇总。借助 AI 加持下的 SpreadsheetLLM，未来企业有望节省许多时间和资源，让员工专注于需要人类判断力和创造力的高价值活动。

参考链接：

https://arxiv.org/abs/2407.09025?ref=thestack.technology

https://www.thestack.technology/microsoft-llm-spreadsheet-llm/

专为 Excel 而生！微软推出新 AI 模型，网友：会计师和数据分析师，危？

炎炎夏日🔥，AI 科技大本营送清凉福利！

版权声明：lida 发表于 2024年9月27日 am12:02。
转载请注明：专为 Excel 而生！微软推出新 AI 模型，网友：会计师和数据分析师，危？ | ChatGPT资源导航