识典古籍平台:推动古籍数字化与智能化整理
平台概况
识典古籍是由抖音公益与北京大学联合打造的古籍阅读平台,旨在为用户提供免费、稳定且高效的古籍检索与阅读服务。该平台的核心目标是完成一万种古籍的智能化整理,涵盖儒家、道家和佛学三大传统思想体系的核心典籍,并将这些珍贵资源免费向公众开放。
技术支撑
- 文字识别技术:通过单个字符切分与顺序识别,实现对古籍影印版文字的精准识别。
- 自动标点技术:采用序列标注方法,为古籍内容进行智能化标点划分。
- 命名实体识别:用于古籍中人名、地名等特定信息的自动化提取。
资源规模与功能
平台目前已收录丰富多样的古籍资源,包括道家经典、文学典籍等类别典籍。高级检索功能支持通过书名、作者、关键词等多种途径进行快速查询。
据项目负责人介绍,目前亟待修复的古籍总量达1000万册件,其中已实现影像数字化扫描8万种,完成文本数字化处理近4万种。
数字化挑战
虽以万种古籍为目标,但受保存状况和质量差异影响,部分古籍需经专业修复整理后方可进行数字化处理。这将是一个持续优化和完善的系统工程。
用AI让经典重新跳动,这个平台开放了3000万古籍字符
深度学习时代的大模型:回顾与展望
2022年10月14日
摘要:本文系统梳理深度学习大模型的发展历程,分析当前主要技术路线,并对未来研究方向提出建设性思考。
一、大模型技术演进路径
深度学习模型规模呈现出显著的指数级增长趋势:
- 2017年:Transformer架构问世,奠定现代大模型基础
- 2018年:BERT、GPT等预训练模型突破参数10亿大关
- 2020年:GPT-3实现千亿参数规模
- 2022年:万亿参数模型成为研究新常态
二、核心技术创新
支撑大模型发展的关键技术主要包含三个方面:
1. 计算架构突破
- 混合精度训练技术
- 分布式训练框架优化
- 稀疏化计算方案
2. 算法设计创新
- 注意力机制改进
- 记忆网络强化
- 多模态融合方法
3. 训练范式变革
- 自监督预训练
- 提示微调(Prompt Tuning)
- 指令微调(Instruction Tuning)
三、重要应用领域
当前大模型已渗透多个关键技术领域:
- 自然语言理解和生成
- 计算机视觉处理
- 跨模态内容生成
- 科学计算模拟
四、未来发展方向
- 模型效率提升:寻求计算成本与模型性能的最优平衡
- 推理能力增强:突破现有统计学习模式的局限性
- 知识更新机制:解决持续学习与灾难性遗忘的矛盾
- 可解释性研究:揭示模型内部运作机制与决策依据
最后,专家呼吁建立大模型研发伦理框架,在推动技术进步的同时确保技术向善。
数据统计
数据评估
关于识典古籍特别声明
云知AI导航收录的「识典古籍」等资源均来自互联网,外部链接的内容与准确性不由本站保证或控制。同时,对于该外部链接的指向,不由云知AI导航实际控制,在2025年8月24日 下午2:55收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,云知AI导航不承担由此产生的任何责任。
相关导航
云上曲率专注AIGC内容安全,服务出海及国内游戏、社交、直播行业,提供全球RTM云信令、即时通讯及多语言内容风控解决方案,涵盖文本、图片、音频、视频审核等安全产品。
MotionSound文本转语音
文本转语音技术可将文字转换为拟人化语音,支持应用于各类程序和工具。用户可通过免费AI工具或Azure、Google云服务等平台实现该功能,提升应用交互体验和可访问性。
阿里云ai-阿里灵杰
阿里AI(阿里灵杰)基于阿里云基础设施,整合大数据、AI工程及行业经验,为企业和开发者提供一站式云原生AI解决方案,优化开发效率,加速AI应用落地。
AI Creator
AI Creator是一款AI创作工具,支持音乐、绘画和文字等内容生成,助力用户轻松实现创意表达。
DALL·E
DALL·E是OpenAI于2021年推出的语言驱动的图像生成模型,能够根据文本描述创作高度细节化且富有创意的图像,在AI图像生成领域实现重大突破。
MakeLogoAI
基于AI技术的Logo生成工具,通过智能算法快速设计个性化标识,满足不同用户需求,提供高效创意解决方案。
彩云小梦AI
彩云小梦AI是一款智能化写作工具,通过分析用户文本不断学习优化,持续提升创作质量。它能识别文章亮点并自我升级,帮助用户高效产出优质内容。
矩池云
矩池云是高性价比深度学习云平台,提供高速网盘、远程工具和DEMO镜像等便利功能,并推出专为高校教学设计的版本,功能更完备。


