本文最后更新于 2025-03-25,文章内容可能已经过时。
重排序模型对比表
模型名称 | 参数量 | 语言支持 | 输入长度 | 多模态 | 核心优势 | RAG提升 | 评分 |
---|
bge-reranker-v2-m3 | 5亿 | 100+语言 | 8192 | ✅ | 多语言长文档/跨语种检索 | 93.46%(HIT@5) | ★★★★★ |
bce-reranker-base_v1 | 3.4亿 | 中英双语 | 512 | ❌ | 中英混合场景/性价比高 | 77.02%(MRR) | ★★★★☆ |
bge-reranker-large | 3.4亿 | 中英 | 512 | ❌ | 中文专项优化/低延迟 | 89.94%(HIT@5) | ★★★★ |
jina-reranker-v2 | 1.3亿 | 50+语言 | 4096 | ✅ | 跨模态联合检索/边缘计算 | 85.2%(HIT@5) | ★★★★☆ |
minicpm-reranker | 2.8亿 | 中英 | 2048 | ❌ | 轻量化部署/端侧推理 | 81.7%(HIT@5) | ★★★★☆ |
音频模型对比表
模型名称 | 中文特性 | TTS质量 | ASR准确率 | 方言支持 | 推荐值 |
---|
CosyVoice2-0.5B | 零样本克隆+情感控制 | MOS 5.8 | - | 粤/川/台 | ★★★★★ |
FishSpeech-1.5 | 文言文识别(CER 0.9%) | - | CER 0.9% | - | ★★★★☆ |
F5-TTS | 轻量边缘部署(RTF 0.12) | - | - | 普通话 | ★★★★ |
ChatTTS | 7级方言调节+情感交互 | MOS 5.6 | - | 粤/闽/东北 | ★★★★☆ |
SenseVoiceSmall | 多任务识别(WER 1.8%) | - | WER 1.8% | 粤/川 | ★★★★★ |
whisper-large-v3 | 噪声转录(WER 4.2% @-5dB) | - | WER 4.2% | 标准普通话 | ★★★☆ |
嵌入模型对比表
模型名称 | 核心优势 | 最佳场景 | 多语言 | 上下文 | 数据量 | 推荐值 |
---|
bge-large-zh-v1.5 | 中文MTEB榜首/法律金融优化 | 中文垂直领域问答 | 中文 | 512 | 3.6亿 | ★★★★★ |
bge-large-en-v1.5 | 英文STEM强化/Top3 | 科技文档理解 | 英文 | 512 | 2.8亿 | ★★★★☆ |
bge-m3 | 多模态混合检索(文本+图像) | 跨模态电商搜索 | 100+ | 2048 | 5.3亿 | ★★★★☆ |
gte-Qwen2 | 动态维度压缩(768→256) | 边缘设备部署 | 中英 | 4096 | 2.1亿 | ★★★★ |
jina-embeddings-v3 | 8k长文本优化/合同检索94% | 法律文档分析 | 50+ | 8192 | 1.8亿 | ★★★★☆ |