Xinference中模型如何选择？

模型名称	参数量	语言支持	输入长度	多模态	核心优势	RAG提升	评分
bge-reranker-v2-m3	5亿	100+语言	8192	✅	多语言长文档/跨语种检索	93.46%(HIT@5)	★★★★★
bce-reranker-base_v1	3.4亿	中英双语	512	❌	中英混合场景/性价比高	77.02%(MRR)	★★★★☆
bge-reranker-large	3.4亿	中英	512	❌	中文专项优化/低延迟	89.94%(HIT@5)	★★★★
jina-reranker-v2	1.3亿	50+语言	4096	✅	跨模态联合检索/边缘计算	85.2%(HIT@5)	★★★★☆
minicpm-reranker	2.8亿	中英	2048	❌	轻量化部署/端侧推理	81.7%(HIT@5)	★★★★☆

模型名称	中文特性	TTS质量	ASR准确率	方言支持	推荐值
CosyVoice2-0.5B	零样本克隆+情感控制	MOS 5.8	-	粤/川/台	★★★★★
FishSpeech-1.5	文言文识别(CER 0.9%)	-	CER 0.9%	-	★★★★☆
F5-TTS	轻量边缘部署(RTF 0.12)	-	-	普通话	★★★★
ChatTTS	7级方言调节+情感交互	MOS 5.6	-	粤/闽/东北	★★★★☆
SenseVoiceSmall	多任务识别(WER 1.8%)	-	WER 1.8%	粤/川	★★★★★
whisper-large-v3	噪声转录(WER 4.2% @-5dB)	-	WER 4.2%	标准普通话	★★★☆

模型名称	核心优势	最佳场景	多语言	上下文	数据量	推荐值
bge-large-zh-v1.5	中文MTEB榜首/法律金融优化	中文垂直领域问答	中文	512	3.6亿	★★★★★
bge-large-en-v1.5	英文STEM强化/Top3	科技文档理解	英文	512	2.8亿	★★★★☆
bge-m3	多模态混合检索(文本+图像)	跨模态电商搜索	100+	2048	5.3亿	★★★★☆
gte-Qwen2	动态维度压缩(768→256)	边缘设备部署	中英	4096	2.1亿	★★★★
jina-embeddings-v3	8k长文本优化/合同检索94%	法律文档分析	50+	8192	1.8亿	★★★★☆

添加图标