AGI-Eval
AI大模型评测社区专注于各类前沿人工智能模型的深度测试与分析,提供专业、全面的评估报告。社区汇聚AI技术专家与开发者,通过标准化评测流程对比不同模型的性能、可靠性和应用场景,搭建开放的交流平台推动技术创新与落地。聚焦大模型前沿发展,为开发者提供有价值的参考信息和技术指导。
LLMEval是由复旦大学NLP实验室推出的大模型评测基准,最新的LLMEval-3聚焦于专业知识能力评测,涵盖哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部划定的13个学科门类、50余个二级学科,共计约20W道标准生成式问答题目。
云知AI导航收录的「LLMEval3」等资源均来自互联网,外部链接的内容与准确性不由本站保证或控制。同时,对于该外部链接的指向,不由云知AI导航实际控制,在2025年8月23日 上午7:18收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,云知AI导航不承担由此产生的任何责任。