多宝体育,多宝体育官方网站,多宝体育APP下载
与之形成鲜明对比的是由学术界推动的LiveBench,其背后平台由图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun) 联合Abacus.AI、纽约大学等机构共同推出的。Abacus.AI 是一家人工智能及机器学习研究商,它帮助LiveBench成长为一个每月更新的“防作弊系统”。其排名依据全部来自最新的数学竞赛、Kaggle数据集或arXiv论文,且有标准答案,旨在从根本上杜绝模型通过记忆旧数据“刷分”,专门检验模型在陌生问题上的真实推理和泛化能力,因此被视作衡量LLM模型“硬实力”的试金石。
此外, OpenRouter Rankings直接基于平台上的实际API调用量进行排名。OpenRouter的商业模式可以概括为“聚合调度+增值服务”。它本身不研发模型,而是作为一个中间层,整合了来自60多家供应商的400多个AI大模型(包括OpenAI、Google、Anthropic等主流厂商以及众多开源模型),然后通过统一的API向开发者提供服务,收取5%-5.5%的服务费 。其发布的模型用量排行榜在开发者和投资圈内也备受关注。