
讯飞公文写作
讯飞公文写作,一款依托于科大讯飞星火大模型技术的AI公文写作助手。讯飞公文提供免费海量素材库,支持公文一键生成、及校对、润色、改写、扩写、续写服务。帮助广大公文专撰稿人高效完成工作总结、心得体会、调研报告、通知公告、讲话稿、请示等各类公文材料的创作,免费使用,简单便捷高效。
中国版对话语言模型,与GLM大模型进行对话。
2024年01月16日,我们在「智谱AI技术开放日(Zhipu DevDay)」推出新一代基座大模型 GLM-4。
我们推出 GLM-4 All Tools、GLMs 智能体、大模型科研基金、大模型开源基金以及「Z计划」创业基金等内容。欢迎前往智谱清言体验 All Tools 以及无代码开发 GLMs 智能体。开发者可通过智谱 MaaS 开放平台体验 GLM-4 128K API、GLM-4V 图片理解和 CogView3 文生图 API。
MMLU (5-shot)
|
GSM8K (5-shot)
|
MATH (4-shot)
|
BBH (3-shot)
|
HellaSwag (10-shot)
|
HumanEval (0-shot)
|
|
---|---|---|---|---|---|---|
GPT-4 | 86.4 | 92.0 | 52.9 | 83.1 | 95.3 | 67.0 |
Gemini-Ultra | 83.7 | 94.4 | 53.2 | 83.6 | 87.8 | 74.4 |
GLM-4 | 81.5 | 87.6 | 47.9 | 82.3 | 85.4 | 72.0 |
GLM-4 / GPT-4 | 94% | 95% | 91% | 99% | 90% | 100% |
IFEval
Prompt级别、中文 |
IFEval
Instruction级别、中文 |
IFEval
Prompt级别、英文 |
IFEval
Instruction级别、英文 |
|
---|---|---|---|---|
GPT-4 | 72.4 | 80.0 | 79.5 | 85.4 |
GLM-4 | 63.4 | 71.9 | 67.7 | 76.4 |
GLM-4 / GPT-4 | 88% | 90% | 85% | 89% |
专业能力
|
中文理解
|
基本任务
|
数学计算
|
文本写作
|
综合问答
|
角色扮演
|
逻辑推理
|
中文推理
|
中文语言
|
总分
|
|
---|---|---|---|---|---|---|---|---|---|---|---|
GPT-4 | 7.94 | 6.93 | 7.81 | 7.65 | 7.93 | 7.42 | 7.51 | 7.37 | 7.47 | 7.59 | 7.53 |
GPT-4 Turbo | 8.65 | 7.33 | 7.99 | 7.80 | 8.67 | 8.61 | 8.47 | 7.66 | 7.73 | 8.29 | 8.01 |
GLM-4 | 8.91 | 8.07 | 7.87 | 7.75 | 8.44 | 8.42 | 8.58 | 7.01 | 7.38 | 8.38 | 7.88 |
GLM-4 / GPT-4 | 112% | 116% | 101% | 101% | 106% | 113% | 114% | 95% | 99% | 110% | 105% |