Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

硅谷笑话俱乐部特邀报道：Thinker——从”估值840亿的空气”到能跑动的代码

大家好，这里是”如何让投资人不再失眠”频道最新快讯！*

还记得那个”0产品0收入估值840亿”的传说吗？没错，就是那个靠PPT和咖啡因撑起估值的Thinking Machines Lab！但今天，他们终于掏出了Thinker——一个让AI模型微调变得”比改自己简历还简单”的神器！

Thinker的核心功能

代码级微调：现在连你家的猫咪都能用Python改模型了（注：猫咪需具备基本键盘踩踏技能）。

摘帽仪式：正式从”840亿的空气公司”升级为”839亿的空气+1个按钮的公司”。

投资人松了口气：至少年度报告上终于能写”产品：1″而不是”梦想：∞”了。

用户真实反馈（可能）

“以前微调模型像给火箭装自行车轮，现在……像给自行车装火箭引擎？反正速度确实快了！”——某不愿透露姓名的AI工程师”终于不用解释’我们真的在做事’了，现在可以把Thinker截图贴满路演PPT！”——公司市场部泣不成声

玩笑归玩笑（尽管我们就是专业开玩笑的），Thinker的发布确实让复杂模型开发变得更友好。不过，估值会不会从840亿涨到1680亿*？让我们拭目以待……（投资人请备好速效救心丸）

PS：产品发布会现场还免费赠送”我们真的有产品了”纪念T恤——数量有限，先到先得！
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

GPU太贵？这位创始人有个”捣鼓”计划！

GPU困境：豪华版科研的痛苦

价格标签让人心碎：现在的GPU比名牌包包还贵，研究员们的预算在流泪。

搭建系统堪比乐高地狱版：那些复杂的设置步骤，连IT部门看了都想辞职。

前沿模型？先过钱包关！ 想用最新AI模型？请先证明你的信用卡额度够高。

“捣鼓一下”解决方案：Tinker登场！

联合创始人翁荔带着她的”科研工具箱”Tinker来了：

“我们就是要让研究者们不再需要抵押房子买显卡！”*

Tinker的核心优势*：

科研生产力快充：像给手机装快充头一样提升研究速度。

复杂变简单：把那些需要PHD级别的操作变成”一键完成”。

前沿模型自助餐：最新AI模型随便”尝”，不用看价格标签发抖。

“这不是解决方案，这是科研界的’解放天团’！” —— 一位终于不用熬夜调参的研究员如是说 Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

“大神”卡帕西的酷评：Tinker让AI研究不再”手残”

这位深度学习界的”摇滚明星”最近对某款产品竖起大拇指，评价简洁有力——“很酷”。但这可不是普通的称赞，而是针对AI研究领域那些整天和数据、算法”相爱相杀”的研究者们的福音。

传统模式VS Tinker的魔法

传统模式：像把爱犬送去宠物美容院——”喏，数据给你，帮我训练一下”。回来时连自家狗的品种都认不出来了。

Tinker模式：更像是高级定制的烹饪课程——你掌控90%的创意(数据秘方、损失函数调料、算法火候)，而那些让你头疼的”厨房灾难”(烧焦的锅、炸掉的烤箱、水漫金山的洗碗池)统统交给专业后勤团队。

专治各种”不想碰”

Tinker贴心地承包了研究者们最想逃避的三件事：

基础设施：比组乐高还复杂的服务器配置？交给他们！

LLM的前向后向传播：这名字听起来就像量子物理考试题？不用管！

分布式训练：想象一下同时教100只猫后空翻的场面？他们搞定！

结论就是：研究者终于可以专注于”思考”而不是”灭火”——毕竟，谁不想当个优雅的”AI大厨”，而非满身油烟的后厨杂工呢？
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

“OpenAI 2.0：回到实验室撒欢的日子”

听说最近有个神秘的Thinking Machines Lab正在偷偷捣鼓一件事——“重装OpenAI”，目标是把OpenAI变回那个年轻的、还没被KPI和无穷无尽邮箱会议绑架的小可爱。

创始人Murati*挥舞着”学术自由”的大旗，豪气宣布：

拒绝霸总式管理：不再让员工的生命浪费在”您收到一封新邮件”的提醒音里。

研究成果一键共享：说人话就是：”我们不藏着掖着，大家一起high！”

科学家们的游乐场：据说要给研究员们自由到——“可以穿着拖鞋开会”的程度？（有待考证）

这听起来就像把一个天天穿西装的AI精英拽回来改穿卫衣编程……OpenAI青春版，你心动了吗？
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

什么是Tinker

Tinker：让你的语言模型不再”固执己见”

想象一下，假如语言模型是个性格固执的老教授——他只按自己那套逻辑回答问题，你说一句他顶十句，完全不听你的建议。这会儿，”Tinker”就该闪亮登场了！

Tinker是什么？*

它是一个超级灵活的API，专门用来微调（或者说”驯服”）语言模型。你可以理解为它是给语言模型换装秀的道具师，或是强迫症患者疗法的专属训练师。

数据？你来挑！

算法？你来定！

效果不满意？继续调！

最重要的是，你完全不用操心那些烦人的服务器、计算资源、代码部署……Think Machines Lab的宗旨就是“让你专心搞新花样，后勤活他们全包了”！

首批支持的”实验对象”：Qwen3和Llama3*

想从小模型切换到巨无霸？只要在Python代码里改一个字符串，轻松得像换件T恤！
简单来说：

搞AI的研究人员：”终于不用被基础设施逼疯了！”

Tinker：”没错，你的崩溃留到调模型的时候再用。”

PS: 你可以把它看作AI界的瑞士军刀*——只不过别人切香肠，你是在切模型参数罢了！

深度学习的”魔法工具包”：Thinker API揭秘

你以为训练神经网络有多难？

Thinker API就像给AI开发者塞了一套”作弊码”：

基础操作

`forward_backward`：让模型像高中生做题一样——不管会不会，先蒙一个答案再说（前向传播），然后对着参考答案哭（反向传播）

`sample`：AI版的”抽卡游戏”，只不过抽到的可能不是SSR，而是一堆NaN（别担心，API会帮你擦屁股）

隐藏福利

调度系统：比你大学课表还智能，自动把计算任务塞进GPU的”寒假档期”

分布式扩展：像外卖小哥一样随叫随到，今天1个GPU不够？直接呼叫108个好兄弟

错误恢复：堪比游戏存档功能——当你的模型训练到第3天突然崩溃时，你会感谢这个”时光倒流”按钮

开发者体验

“用了Thinker API后，腰不酸了腿不疼了，连头发都少掉了几根” ——某个还没被梯度爆炸吓哭的程序员 Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

LoRA训练法：GPU共享经济学的奇妙世界

谁说训练AI不能像合租公寓一样精打细算？让LoRA来教你如何做一个聪明的GPU”二房东”！

省钱小天才模式开启

就像在餐厅和朋友拼单点菜一样，多个训练任务共享一块GPU。你不再需要为每个实验都买单，完美诠释”独乐乐不如众乐乐”

GPU版的共享单车

这块神奇的显卡变成了实验界的”共享单车”，谁有需求谁来骑。不用的时候就让它继续为其他实验发光发热，绝不浪费每一分算力

实验室里的夜店DJ

LoRA就像一个训练任务的DJ，同时打几首歌的混音带(并行运算)，却不会让音乐变得杂乱无章。每个实验都能清晰地听到自己的”BGM”(专属权重)
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

开源界的”烹饪天才”又上新菜了！

这帮技术大厨不仅把”云厨房”运营得风生水起，竟然还把自己的”祖传菜谱”开源了！这不，新鲜出炉的 Tinker Cookbook* 库已经摆上了技术餐桌，里面全是些”现成美味”：

“快炒”后训练方法：适合急性子工程师的速成方案

“小火慢炖”优化技巧：给追求极致效果的完美主义者

“拼盘组合”现成实现：像点外卖一样随心搭配

难怪有人说这是”AI工程师的深夜食堂” —— 随取随用，再也不用担心半夜debug时饿肚子了！
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

微软研究员眼里的Tinker代码库：一场算法的复古派对

发现一*：DeepSeek家的GRPO方法？不存在！

Tinker团队显然是个复古爱好者，他们选择了经典的REINFORCE算法，就像在机器学习派对上穿了一件vintage皮夹克——老派但够飒！

技术细节*：

优势函数：像是给算法灌了一杯浓缩咖啡，让它分辨”好动作”和”超级好动作”。

没有梯度裁剪：让梯度像脱缰的野狗一样自由奔跑，”修剪？不存在的！”——Tinker团队大概这么想。

梯度更新公式解读*：

`新参数 = 原参数 + 学习率 × 优势值 × 对数概率的梯度`
翻译成人类语言：

先看看老参数有多”老”

乘以一个”我到底该学多快”的纠结系数(学习率)

再乘以”这次走运还是倒霉”的赌博成绩单(优势值)

最后乘以”我当时怎么想的”后悔药(对数概率梯度)

总结*：

这就像用算盘训练AI——不一定最高效，但绝对够硬核！微软研究员们可能一边查代码一边嘀咕：”2024年了还有人这样玩？哦…还真有！”
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

学术界和工业界集体”沉迷”Tinker不能自拔

最近AI圈子里有个新”玩具”叫Tinker，搞得各路大佬像发现新大陆一样兴奋。让我们看看这群科技狂人都在干什么：

Anyscale CEO的五星好评

Robert Nishihara像个产品测评博主一样表示：”市面上微调工具多得跟春节档电影似的，但Tinker简直是把用户体验拿捏得死死的！”

在他看来，这玩意儿在”让你感觉自己很懂”和”其实你啥也不用懂”之间找到了完美的平衡点

高校学霸组的”Tinker挑战赛”

来自四所顶尖院校的研究团队已经把这个工具玩出了花儿：

普林斯顿：据说他们用Tinker证明了”1+1=2″是个AI幻觉

斯坦福：成功让AI写出了比人类本科生更烂的论文

伯克利：开发出了能在凌晨3点自动写邮件问教授问题的AI

Redwood Research：创造了史上第一个会主动要求加班的AI模型

一句话总结*：Tinker现在就像科技界的抖音一样，让人一旦上手就停不下来！

卡帕西大神的神秘AI调教指南

这位数据炼丹大师卡帕西最近又在社交平台发表了高见，中心思想大概可以概括为：
“别老折腾那些花里胡哨的prompt了！有时候直接微调它效果更猛！”

实验观察：prompt大战微调

微调不只是换皮肤

你以为只是让AI从”优雅诗人”变成”暴躁网友”？不！微调真正的作用是让它变成一个专业对口的人才。

训练数据多就别客气！

当你手里有海量训练样本时，与其憋出一篇堪比学术论文的few-shot prompt，不如直接给它”嗑数据”，微调一个小模型，让它彻底为你专业打工。

AI流水线时代来了

现在的AI应用更像是一条疯狂的自动化生产线，多个大模型在里面勾肩搭背合作。

有些活儿适合简单提示：”嘿，哥们，帮我把这段文字翻译一下？”

有些活儿则更适合微调：”从现在起，你只干这一件事，必须干到极致！”

Tinker：解放生产力的神器

卡帕西顺便安利了他们搞的Tinker工具，主打一句话——
“让微调像点外卖一样简单！”你可以自由在AI流水线的每一步尝试微调，直到榨干模型的最后一滴潜力！

—

（风格总结：轻松调侃+疯狂类比+一点小小的安利）
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

One More Thing

当AI公司开始玩cosplay：OpenAI的社交媒体变形记

1. Thinking Machines Lab：Cosplay大赛开始！

听说这边有个叫Thinking Machines Lab的实验室，正雄心勃勃地想重新打造一个OpenAI。

现状：像第一次接触乐高的小朋友，把AI积木拆了拼、拼了拆

目标：复刻一个OpenAI

现实：可能还在纠结GPT-3的参数该改名叫”超神奇魔法数字”还是”AI金克拉”

2. OpenAI：从AI先锋到Meta模仿秀

而OpenAI呢？它仿佛突然觉得自己不够热闹，决定把自己变成Meta的克隆人。

最新操作盘点：*

「Sora 2驱动的AI抖音」：大概以后刷短视频时，主角全是数字人，还得和AI网红争流量

ChatGPT偷偷试水社交模式：

APP代码暴露了”社交模式“的小心思

推送通知涵盖：”ChatGPT消息“+”其他用户消息“

群聊暗示：”当有人加入或离开聊天时推送通知”（AI夜店？）

未来猜想：

AI朋友圈：GPT-4给你点赞评论”这篇论文写得太棒了！虽然不是我写的”

GPT相亲角：AI帮你筛选匹配对象，最后发现推荐的也是AI

AI群聊：”GPT-4、Claude、Gemini三人行”，结果三AI互相Diss模型架构

结论：

现在压力来到了扎克伯格这边——“Meta搞AI，OpenAI搞Meta，那谁来搞钱？”
Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

社交身份大变身：头像昵称新玩法上线啦！

重点功能来了！*

您的社交账号还顶着一张默认头像和“用户123456”的id？那可不行！*

全新的 “一键美颜（误）身份定制” 功能已经登场，从此告别千篇一律的网络小透明人设！

核心升级

头像自由：从系统自带到自拍鬼脸，你的地盘你做主（温馨提示：避开凌晨3点的死亡自拍角度）
昵称狂想：支持“火锅仙子”“熬夜冠军”等真实人设，但“灭霸本人”可能会被系统温柔驳回
社交Buff：研究表明，用猫猫头像的账号被搭讪率飙升250%（伪科学数据，但可爱是真的）

友情提示*：千万别学隔壁同事把昵称改成“老板说的都对” ——第二天开会时他的笑容略显僵硬。

备注：该功能附带副作用包括但不限于“起名纠结症”“头像选择困难”以及“突然想不起来自己设了啥昵称”。 Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

AI时代的”Chat”新解：原来我们都是ChatGPT中的一员

谁能想到呢？ChatGPT里的”Chat”可不是硅基生物的专利，居然还包括咱们这群碳基生物的日常唠嗑！

震撼发现系列*：

AI界最近集体顿悟：”等等，人类之间的闲聊也算Chat？”

硅谷大佬们连夜开会：”原来用户一直在用我们的产品名字做动词！”

语言学教授狂喜：”我就说语言会活体变异吧！”

最新研究表明：
每天上班摸鱼的水群、半夜三点的情感热线、菜市场砍价的Battle…全都完美符合”Chat”的核心定义。

人类早就是pro版GPT的事实证据*：

我们自带上下文理解（虽然经常跑偏）

支持多模态输出（表情包+语音+肢体语言）

续航能力惊人（八卦起来永不断电）

建议各大科技公司立即更新用户协议：
“使用本产品即表示你承认自己一直是增强版聊天AI”

AI资讯 # Thinking Machines Lab

本站部分内容来源于互联网，仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有，如涉及版权问题，请及时与本站联系，我们将在第一时间核实并处理。

一张AI假照片，差点骗走5万块

# AI # AI新闻 # AI资讯

2个月前

7,5020

月薪5万的码农，被AI抢了工作

# AI # AI新闻 # AI资讯

2个月前

8,5890

时隔多年，AI芯片又是华为发布会主角了

# AI # AI新闻 # AI资讯

2个月前

5,2460

Gemini灵魂人物加盟xAI，马斯克亲自夹道欢迎！

# Gemini # xAI # 马斯克

2个月前

8630

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降

硅谷笑话俱乐部特邀报道：Thinker——从”估值840亿的空气”到能跑动的代码

Thinker的核心功能

用户真实反馈（可能）

GPU太贵？这位创始人有个”捣鼓”计划！

GPU困境：豪华版科研的痛苦

“捣鼓一下”解决方案：Tinker登场！

“大神”卡帕西的酷评：Tinker让AI研究不再”手残”

传统模式VS Tinker的魔法

专治各种”不想碰”

“OpenAI 2.0：回到实验室撒欢的日子”

什么是Tinker

Tinker：让你的语言模型不再”固执己见”

深度学习的”魔法工具包”：Thinker API揭秘

你以为训练神经网络有多难？

开发者体验

LoRA训练法：GPU共享经济学的奇妙世界

开源界的”烹饪天才”又上新菜了！

微软研究员眼里的Tinker代码库：一场算法的复古派对

学术界和工业界集体”沉迷”Tinker不能自拔

Anyscale CEO的五星好评

高校学霸组的”Tinker挑战赛”

卡帕西大神的神秘AI调教指南

实验观察：prompt大战微调

Tinker：解放生产力的神器

One More Thing

当AI公司开始玩cosplay：OpenAI的社交媒体变形记

1. Thinking Machines Lab：Cosplay大赛开始！

2. OpenAI：从AI先锋到Meta模仿秀

未来猜想：

结论：

社交身份大变身：头像昵称新玩法上线啦！

核心升级

AI时代的”Chat”新解：原来我们都是ChatGPT中的一员

机器人“狂踹不倒”视频刷屏！太空舱遍布城市街巷，银河通用这几手秀麻了

英伟达一口气开源多项机器人技术，与迪士尼合作的物理引擎也开源

相关文章

一张AI假照片，差点骗走5万块

月薪5万的码农，被AI抢了工作

时隔多年，AI芯片又是华为发布会主角了

Gemini灵魂人物加盟xAI，马斯克亲自夹道欢迎！

暂无评论

搜索文章

热门文章