这个提示词解决什么问题

每次看TradingView上的财报新闻,密密麻麻的英文,想快速对比几家公司的营收、净利润?手动扒表格太累。让AI帮你做结构化提取——直接把一段新闻文本转成JSON,省得你写正则或者爬虫。

核心思路

关键不是让AI“读懂”内容,而是给它一个明确的“输出格式指令”。普通Prompt会说“提取关键数据”,结果AI给你一段散文;好Prompt会定义字段、数据类型、示例,甚至告诉它如果找不到数据就填null。另外,加上一条“禁止输出任何解释”,直接给JSON,方便你后续代码消费。

完整提示词模板(可直接复制)

markdown
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
你是一个金融数据提取助手。用户会给你一段财报新闻或表格文本,你需要从中提取以下字段,并以JSON格式输出:

- company_name: 公司名称(字符串)
- fiscal_year: 财报年份(字符串,如"2025/26")
- revenue: 营收(数字,单位:百万日元,如12000)
- operating_income: 营业利润(数字,单位:百万日元)
- net_income: 净利润(数字,单位:百万日元)
- currency: 货币(字符串,如"JPY")

提取规则:
1. 如果某个字段在文本中未明确给出,请填入null。
2. 数值去掉逗号和货币符号,直接保留数字。
3. 如果利润显示为负数,使用负号。
4. 只输出JSON代码块,不要输出任何其他文字、解释或前缀。

示例输入:
"Kitazawa Sangyo reported parent revenue of ¥12,345 million for FY2025/26, operating income ¥567 million, net income ¥89 million."

示例输出:
```json
{
  "company_name": "Kitazawa Sangyo",
  "fiscal_year": "2025/26",
  "revenue": 12345,
  "operating_income": 567,
  "net_income": 89,
  "currency": "JPY"
}

现在,请处理以下输入:
{{输入文本}}

text
1 2 3 4 5 6 7

## 效果演示

### 差Prompt
```text
从这段话中提取财务数据:
[粘贴新闻]

输出(典型结果)

根据文本,Kitazawa Sangyo 在2025/26财年的营收为123.45亿日元,营业利润5.67亿日元,净利润0.89亿日元。注意单位是亿日元。

问题:输出是自然语言,单位不统一,还要手动解析;没有JSON结构,无法直接喂给程序。

好Prompt(使用上面的模板)

输入(模拟TradingView新闻风格)

text
1 2 3 4 5
TABLE-Kitazawa Sangyo -2025/26 parent results — TradingView News.
* Revenue: ¥12,345 million
* Operating income: ¥567 million
* Net income: ¥89 million
* Currency: JPY

输出

json
1 2 3 4 5 6 7 8
{
  "company_name": "Kitazawa Sangyo",
  "fiscal_year": "2025/26",
  "revenue": 12345,
  "operating_income": 567,
  "net_income": 89,
  "currency": "JPY"
}

优势:干净JSON,字段明确,可直接丢给前端或数据库。

为什么这样写有效

  1. 显式定义字段和类型:告诉AI你想要什么,避免它自由发挥。
  2. 提供示例:Few-shot示例让输出格式稳定,尤其是JSON的括号和逗号位置。
  3. 限制输出格式:强制只输出代码块,消除任何多余解释——很多Prompt失败是因为AI喜欢说“根据文本,我提取了……”这种废话。
  4. 处理缺失值:用null代替空字段,防止AI胡编乱造(幻觉)。

变体和注意事项

变体1:多公司同时提取

如果你给一段包含多家公司的新闻,可以改字段为数组:

json
1 2 3 4 5 6 7 8 9 10 11 12
{
  "reports": [
    {
      "company_name": "Kitazawa Sangyo",
      ...
    },
    {
      "company_name": "Ohashi Technica",
      ...
    }
  ]
}

在Prompt里加一句“如果文本包含多家公司,以数组形式输出所有公司”,并提供一个示例。

变体2:支持不同货币

在字段里加一个currency,并让AI自动识别文本中的货币符号(¥、$、€)。如果遇到混合货币,可以让AI根据上下文决定,或者输出时带上多个货币字段。

注意事项

  • 输入文本的质量:新闻摘要通常干净,但如果是OCR后的PDF文字可能有乱码,先做预处理。
  • 大模型风险:GPT-4o和Claude 3.5对这类提取任务表现很好,但免费模型可能格式不稳定。建议先用示例测试一次,再批量用。
  • 不要过度依赖:财报有时有特殊项目(比如“non-GAAP”),需要你手动审核数值是否准确。这个Prompt只适合快速预览,不适合审计。

试试把上面模板里的{{输入文本}}换成你手头的财报新闻,跑一次就知道多省时间了。


如果你觉得单个JSON不够,想直接生成表格,改输出为Markdown表格即可,类似思路。