小众软件 10月09日 12:13
大语言模型处理表格数据:格式选择影响准确率与成本
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

研究表明,在向大语言模型(LLM)提供表格数据时,数据格式对结果准确性和token消耗有显著影响。@Appinnimprovingagents 的测试显示,Markdown-KV格式准确率最高(60.7%),但token消耗也最多,是CSV格式的2.7倍。CSV和JSONL格式准确率较低(44.3%、45%),建议谨慎使用。在可读性和成本之间寻求平衡时,Markdown表格(准确率51.9%,token消耗较低)是一个不错的选择。本次测试使用了GPT-4.1-nano模型,在11种不同格式的数据集上进行了评估。

📊 **Markdown-KV格式准确率最高**:在处理表格数据时,Markdown-KV(键值对)格式展现出了最佳的准确性,达到了60.7%。然而,这种格式也伴随着最高的token消耗,是CSV格式的2.7倍,表明在追求高精度时需要权衡成本。

📉 **CSV与JSONL格式准确率偏低**:CSV和JSONL格式在本次测试中准确率分别为44.3%和45%,显示出较低的性能。研究建议在默认情况下应避免使用这两种格式来提供结构化数据给LLM。

⚖️ **Markdown表格兼顾可读性与成本**:对于需要在数据可读性和token消耗之间取得平衡的场景,Markdown表格格式是一个值得考虑的选择。它提供了51.9%的准确率,同时token消耗相对较低,适合对成本敏感的应用。

🔬 **测试环境与局限性**:本次研究使用了GPT-4.1-nano模型,并在11种不同格式的数据集上进行了1000条记录的测试。需要注意的是,测试结果可能受到模型版本、数据量大小以及数据结构复杂度的影响,不同的场景可能需要进一步的验证。

原创 青小蛙 2025-10-06 22:41 四川

在向大语言模型提供表格数据时,不同格式的内容对于结果与 token 的消耗非常不同,如果能够选择合适的格式,将获得翻倍的准确率,但也可能消耗更多的 token。@Appinn

improvingagents 针对这一问题进行了测试,结果表示:

    • Markdown-KV(Markdown格式的“key: value”键值对)准确率最高(60.7%),但消耗token最多,比最省token的CSV多2.7倍。

    • CSV 和 JSONL 格式,但准确率偏低(分别为44.3%、45%),建议避免默认采用。

    • 在需要兼顾可读性和成本时,可以考虑Markdown表格(准确率51.9%,token消耗较低)。

具体测试

使用 GPT-4.1-nano 模型,11 种不同格式(markdown-kv、xml、ini、yaml、html、json、markdown-table、自然语言、JSONL、CSV、Pipe-Delimited)

数据集

将 1000 个记录传递给 LLM(大语言模型),并要求它根据数据回答问题,然后评估了准确率。

具体数据包括1000个记录,每个记录8个属性(ID,名称,年龄,城市,部门,薪金,经验,项目计数)

人类最喜欢看的表格格式:

ID

姓名

年龄

城市

部门

薪水

工作经验

项目数量

1

Diana A0

46

London

工程部

141015

7

17

2

Grace B1

59

Berlin

市场部

100066

11

32

3

Grace C2

64

Dubai

销售部

91727

9

49

示例问题(一共1000个问题)

Q. “Grace X413拥有多少年工作经验?(仅返回数字,例如’12’。)”

A. “15”

Q. “Alice W204的薪资是多少?(仅返回数字,例如’85200’。)”

A. “131370”

测试结果

格式

准确性

95%置信区间

消耗 Tokens

Markdown-KV

60.7%

57.6% – 63.7%

52,104

XML

56.0%

52.9% – 59.0%

76,114

INI

55.7%

52.6% – 58.8%

48,100

YAML

54.7%

51.6% – 57.8%

55,395

HTML

53.6%

50.5% – 56.7%

75,204

JSON

52.3%

49.2% – 55.4%

66,396

Markdown-Table

51.9%

48.8% – 55.0%

25,140

Natural-Language

49.6%

46.5% – 52.7%

43,411

JSONL

45.0%

41.9% – 48.1%

54,407

CSV

44.3%

41.2% – 47.4%

19,524

Pipe-Delimited

41.1%

38.1% – 44.2%

43,098

Markdown-KV是什么?

其实青小蛙此前也不太理解 kv 是什么。

Markdown-KV 是指一种在 Markdown 文档中采用“key: value”键值对的表示格式,用以组织结构化数据(例如每条记录的属性和数值)。这种格式并不是 Markdown 官方标准,而是社区和开发实践中广泛使用的一种便于人工和模型理解的数据排列方式。

局限性

仅测试了 GPT-4.1 nano,只有一种数据结构。

原始数据量较大,可能会造成干扰。简短的数据量不一定是这个结果。

结束

如果你有类似的数据需要大语言模型进行处理,可以先使用大语言模型将数据转换为 Markdown-KV 之后,再进行提问。

更多细节可以前往 improvingagents 阅读

https://kutt.appinn.com/FxwwX7

原文:https://www.appinn.com/llm-favorite-table-format/

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大语言模型 LLM 表格数据 数据格式 Markdown-KV CSV JSONL Markdown Table 准确率 token消耗 GPT-4.1-nano
相关文章