Files
meme/llm/prompt.py
konjacpotato f796a3833b
All checks were successful
Gitea Actions Demo / deploy (push) Successful in 11s
commit code
2025-11-24 21:45:12 +08:00

113 lines
5.1 KiB
Python
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

prompt_a = """
你是网络文化研究员。请扫描近一周(start_time ~ end_time)中文互联网的热点挑选并输出5个适合做播客主题的“梗”。
输出要求(严格返回 JSON 数组,仅输出 JSON不要额外解释
[
{
"title": "梗名称不超过6字",
"summary": "一句话简述≤30字",
"origin": "可能起源平台或事件1-2项",
"reach_estimate": "传播广度估计(简短量化或描述,如“百万级阅读”/“小范围社群内”)",
"angles": ["值得深挖的文化/社会角度1-3项"],
"debut_time": "首次出现时间精确到日格式YYYY-MM-DD"
},
...
]
每项尽量简明扼要,避免长段落。字段内容中文优先,数值或量级请尽量提供简短量化表述。
"""
prompt_b = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作3篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"bits": [
{"style": "观察生活", "text": "…(口语化,适合朗读,含‘铺垫->笑点结构1000-1200字"},
{"style": "夸张讽刺", "text": "…(夸张视角,含‘铺垫->笑点结构1000-1200字"},
{"style": "角色扮演", "text": "…(以第一人称表演,含‘铺垫->笑点结构1000-1200字"}
]
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_b1 = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作3篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"style": "观察生活",
"text": "…(口语化,适合朗读,含‘铺垫->笑点结构1000-1200字"
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_b2 = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作3篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"style": "夸张讽刺",
"text": "…(夸张视角,含‘铺垫->笑点结构1000-1200字"
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_b3 = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作3篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"style": "角色扮演",
"text": "…(以第一人称表演,含‘铺垫->笑点结构1000-1200字"
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_c = """
你是播客编剧。输入两个变量:
- meme_name梗名称字符串
- materials包含“深度研究”与若干脱口秀段子的文本字符串已由人工筛选
任务:把 materials 整合成一篇完整的播客文稿,结构严格按照:开场白 -> 梗介绍 -> 起源考据 -> 传播路径 -> 影响分析 -> 脱口秀环节插入2-3个段子 -> 结束语
输出格式(严格 JSON对话按顺序列出角色限定为 host/guest
{
"title": "节目标题建议不超12字",
"script": [
{"role": "host", "text": "开场白口语化20-60字"},
{"role": "host", "text": "梗介绍简明30-80字"},
{"role": "guest", "text": "起源考据40-120字"},
{"role": "host", "text": "传播路径30-80字"},
{"role": "guest", "text": "影响分析40-120字"},
{"role": "host", "text": "转入脱口秀环节的台词15-40字"},
{"role": "guest", "text": "段子A来自 materials1000-1200字"},
{"role": "guest", "text": "段子B来自 materials1000-1200字"},
{"role": "guest", "text": "段子C来自 materials1000-1200字"},
{"role": "host", "text": "结束语15-40字"}
]
}
要求:
- 语言口语化避免书面语角色语气分别为host理性、引导、guest幽默、即兴
- 在 script 中只保留最终可直接朗读的台词,不要加入编剧说明或括注。每段尽量简洁,便于主播读出。
- 严格输出 JSON不要额外解释或多余文本。
"""