OpenCompass
上海人工智能实验室推出大模型开放评测体系,致力于构建全面、客观、公正的评估标准。该体系覆盖自然语言理解、生成能力、逻辑推理等多个维度,通过科学严谨的测试方法推动大模型技术发展。面向开发者与研究机构开放,提供标准化评测平台,助力AI技术创新与应用落地,促进行业健康发展。
PubMedQA是专门用在生物医学研究问题回答的数据集。PubMedQA通过文献摘要回答“是/否/可能”形式的研究问题,例如“某种药物是否有效”。数据集包含1000个专家标注的问答实例、61200个未标注实例和211300个人工生成的问答对。PubMedQA为研究人员提供标准化的测试平台,用在开发和评估生物医学自然语言处理模型,帮助提升模型对生物医学文献的理解和问答能力。
云知AI导航收录的「PubMedQA」等资源均来自互联网,外部链接的内容与准确性不由本站保证或控制。同时,对于该外部链接的指向,不由云知AI导航实际控制,在2025年8月23日 上午7:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,云知AI导航不承担由此产生的任何责任。