
识典古籍平台:推动古籍数字化与智能化整理
平台概况
识典古籍是由抖音公益与北京大学联合打造的古籍阅读平台,旨在为用户提供免费、稳定且高效的古籍检索与阅读服务。该平台的核心目标是完成一万种古籍的智能化整理,涵盖儒家、道家和佛学三大传统思想体系的核心典籍,并将这些珍贵资源免费向公众开放。
技术支撑
- 文字识别技术:通过单个字符切分与顺序识别,实现对古籍影印版文字的精准识别。
- 自动标点技术:采用序列标注方法,为古籍内容进行智能化标点划分。
- 命名实体识别:用于古籍中人名、地名等特定信息的自动化提取。
资源规模与功能
平台目前已收录丰富多样的古籍资源,包括道家经典、文学典籍等类别典籍。高级检索功能支持通过书名、作者、关键词等多种途径进行快速查询。
据项目负责人介绍,目前亟待修复的古籍总量达1000万册件,其中已实现影像数字化扫描8万种,完成文本数字化处理近4万种。
数字化挑战
虽以万种古籍为目标,但受保存状况和质量差异影响,部分古籍需经专业修复整理后方可进行数字化处理。这将是一个持续优化和完善的系统工程。
用AI让经典重新跳动,这个平台开放了3000万古籍字符
深度学习时代的大模型:回顾与展望
2022年10月14日
摘要:本文系统梳理深度学习大模型的发展历程,分析当前主要技术路线,并对未来研究方向提出建设性思考。
一、大模型技术演进路径
深度学习模型规模呈现出显著的指数级增长趋势:
- 2017年:Transformer架构问世,奠定现代大模型基础
- 2018年:BERT、GPT等预训练模型突破参数10亿大关
- 2020年:GPT-3实现千亿参数规模
- 2022年:万亿参数模型成为研究新常态
二、核心技术创新
支撑大模型发展的关键技术主要包含三个方面:
1. 计算架构突破
- 混合精度训练技术
- 分布式训练框架优化
- 稀疏化计算方案
2. 算法设计创新
- 注意力机制改进
- 记忆网络强化
- 多模态融合方法
3. 训练范式变革
- 自监督预训练
- 提示微调(Prompt Tuning)
- 指令微调(Instruction Tuning)
三、重要应用领域
当前大模型已渗透多个关键技术领域:
- 自然语言理解和生成
- 计算机视觉处理
- 跨模态内容生成
- 科学计算模拟
四、未来发展方向
- 模型效率提升:寻求计算成本与模型性能的最优平衡
- 推理能力增强:突破现有统计学习模式的局限性
- 知识更新机制:解决持续学习与灾难性遗忘的矛盾
- 可解释性研究:揭示模型内部运作机制与决策依据
最后,专家呼吁建立大模型研发伦理框架,在推动技术进步的同时确保技术向善。
数据统计
数据评估
关于识典古籍特别声明
云知AI导航收录的「识典古籍」等资源均来自互联网,外部链接的内容与准确性不由本站保证或控制。同时,对于该外部链接的指向,不由云知AI导航实际控制,在2025年8月24日 下午2:55收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,云知AI导航不承担由此产生的任何责任。
相关导航

Azure AI平台整合优质AI服务,包含影视配音角色"晓晓"及OpenAI先进模型GPT-3.5与GPT-4调用能力,为用户提供智能语音与对话服务支持。

矩池云
矩池云是高性价比深度学习云平台,提供高速网盘、远程工具和DEMO镜像等便利功能,并推出专为高校教学设计的版本,功能更完备。

Aipix
Aipix是一家专注于图像识别与处理的人工智能公司,提供高效、安全的智能图像分析解决方案。公司致力于将先进技术应用于安防、医疗等多个领域,持续推动技术创新与行业深度融合发展。

图像转绘
图像转绘技术利用AI实现多样化图像处理功能,不同工具具备独特操作方式,需根据具体文档使用。

Dreamphilic
Dreamphilic是一款AI内容首页生成工具,通过智能算法自动设计专业、吸引人的首页布局和内容,精准匹配用户需求与偏好,并支持分阶段优化。

宝藏昇腾AI应用
华为昇腾AI全栈软件平台是覆盖基础软件到应用使能的综合平台,作为华为普惠AI的核心基座,该平台显著提升AI开发效率并最大化释放硬件算力,确保AI技术在实际应用中的卓越性能表现。

BitaHub
BitaHub是云端AI平台,支持快速构建训练AI模型,简化开发流程,助力用户专注业务创新与科研突破。

阿里云ai-阿里灵杰
阿里AI(阿里灵杰)基于阿里云基础设施,整合大数据、AI工程及行业经验,为企业和开发者提供一站式云原生AI解决方案,优化开发效率,加速AI应用落地。