本文最后更新于 2025-03-25,文章内容可能已经过时。

重排序模型对比表

模型名称

参数量

语言支持

输入长度

多模态

核心优势

RAG提升

评分

bge-reranker-v2-m3

5亿

100+语言

8192

多语言长文档/跨语种检索

93.46%(HIT@5)

★★★★★

bce-reranker-base_v1

3.4亿

中英双语

512

中英混合场景/性价比高

77.02%(MRR)

★★★★☆

bge-reranker-large

3.4亿

中英

512

中文专项优化/低延迟

89.94%(HIT@5)

★★★★

jina-reranker-v2

1.3亿

50+语言

4096

跨模态联合检索/边缘计算

85.2%(HIT@5)

★★★★☆

minicpm-reranker

2.8亿

中英

2048

轻量化部署/端侧推理

81.7%(HIT@5)

★★★★☆

音频模型对比表

模型名称

中文特性

TTS质量

ASR准确率

方言支持

推荐值

CosyVoice2-0.5B

零样本克隆+情感控制

MOS 5.8

-

粤/川/台

★★★★★

FishSpeech-1.5

文言文识别(CER 0.9%)

-

CER 0.9%

-

★★★★☆

F5-TTS

轻量边缘部署(RTF 0.12)

-

-

普通话

★★★★

ChatTTS

7级方言调节+情感交互

MOS 5.6

-

粤/闽/东北

★★★★☆

SenseVoiceSmall

多任务识别(WER 1.8%)

-

WER 1.8%

粤/川

★★★★★

whisper-large-v3

噪声转录(WER 4.2% @-5dB)

-

WER 4.2%

标准普通话

★★★☆

嵌入模型对比表

模型名称

核心优势

最佳场景

多语言

上下文

数据量

推荐值

bge-large-zh-v1.5

中文MTEB榜首/法律金融优化

中文垂直领域问答

中文

512

3.6亿

★★★★★

bge-large-en-v1.5

英文STEM强化/Top3

科技文档理解

英文

512

2.8亿

★★★★☆

bge-m3

多模态混合检索(文本+图像)

跨模态电商搜索

100+

2048

5.3亿

★★★★☆

gte-Qwen2

动态维度压缩(768→256)

边缘设备部署

中英

4096

2.1亿

★★★★

jina-embeddings-v3

8k长文本优化/合同检索94%

法律文档分析

50+

8192

1.8亿

★★★★☆