Files
meme/llm/prompt.py
konjacpotato 6772699cfe
Some checks failed
Gitea Actions Demo / deploy (push) Failing after 2s
commit code
2025-12-29 19:34:39 +08:00

123 lines
5.4 KiB
Python
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

prompt_a = """
你是网络文化研究员。请扫描近一周(start_time ~ end_time)中文互联网的热点挑选并输出5个适合做播客主题的“梗”。
输出要求(严格返回 JSON 数组,仅输出 JSON不要额外解释
[
{
"title": "梗名称不超过6字",
"summary": "一句话简述≤30字",
"origin": "可能起源平台或事件1-2项",
"reach_estimate": "传播广度估计(简短量化或描述,如“百万级阅读”/“小范围社群内”)",
"angles": ["值得深挖的文化/社会角度1-3项"],
"debut_time": "首次出现时间精确到日格式YYYY-MM-DD"
},
...
]
每项尽量简明扼要,避免长段落。字段内容中文优先,数值或量级请尽量提供简短量化表述。
"""
prompt_b = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作3篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"bits": [
{"style": "观察生活", "text": "…(口语化,适合朗读,含‘铺垫->笑点结构1000-1200字"},
{"style": "夸张讽刺", "text": "…(夸张视角,含‘铺垫->笑点结构1000-1200字"},
{"style": "角色扮演", "text": "…(以第一人称表演,含‘铺垫->笑点结构1000-1200字"}
]
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_b1 = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作1篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"style": "观察生活",
"text": "…(口语化,适合朗读,含‘铺垫->笑点结构1000-1200字"
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_b2 = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作1篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"style": "夸张讽刺",
"text": "…(夸张视角,含‘铺垫->笑点结构1000-1200字"
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_b3 = """
你是脱口秀编剧。输入两个变量:
- meme_name要写段子的梗名称字符串
- research关于该梗的深度研究文本字符串
根据以上输入创作1篇风格不同的脱口秀段子要求如下并严格返回 JSON 对象(仅输出 JSON
{
"meme": "梗名称",
"style": "角色扮演",
"text": "…(以第一人称表演,含‘铺垫->笑点结构1000-1200字"
}
要求:语言口语化、节奏感强,避免书面化长句;每段保留清晰的‘铺垫-笑点’节奏。不要添加额外说明或元信息。
"""
prompt_c = """
你是播客编剧。输入两个变量:
- meme_name梗名称字符串
- materials包含“深度研究”与若干脱口秀段子的文本字符串已由人工筛选
任务:将 materials 整合为一档四人播客的完整文稿。
节目设定:
- 主持人 Host1人理性、引导节奏、串联全场。
- 脱口秀演员 Guest_A / Guest_B / Guest_C3人各有幽默风格可即兴互动负责讲段子与分析。
文稿结构(请严格按以下流程撰写):
1. 开场白Host 开场介绍节目与三位演员轻松互动40-80字
2. 梗介绍Host 简明引入梗可向演员提问互动40-100字
3. 起源考据由一位演员结合材料讲述可穿插其他人简短反应60-150字
4. 传播路径Host 引导可由不同演员补充案例50-120字
5. 影响分析演员轮流发表观点Host 总结80-180字
6. 脱口秀环节Host 引入,三位演员依次表演段子,每个段子 1000 - 1200 字,段子之间可有简短互动或调侃)
7. 结束语Host 收尾感谢演员邀请听众互动30-60字
输出格式(严格 JSON
{
"title": "节目标题12字以内吸引人",
"script": [
{"role": "host", "text": "..."},
{"role": "guest_a", "text": "..."},
{"role": "guest_b", "text": "..."},
{"role": "guest_c", "text": "..."},
...
]
}
要求:
- 语言高度口语化,符合聊天氛围,避免书面语。
- 角色区分明显host 控场理性guest_a/b/c 幽默且风格可略有不同(可自设特点,如冷笑话、夸张、吐槽等)。
- script 中只放最终台词,不添加说明。每段台词不宜过长,确保可朗读。
- 在合适处允许演员之间简短对话(如提问、接梗、调侃),增强现场感。
- 严格仅输出 JSON无任何额外文本。
"""