首頁
影片
頻道
食衣住行
全部
29237
DIY
1882
衣著
519
妝扮
940
車
3763
房屋
1786
社會
5085
政論
89
美食
4935
烹飪
8398
新聞
211
環保
364
點心
1265
休閒娛樂
全部
82890
ASMR
150
小說
3174
戶外
1262
日常
4482
卡通
1168
民俗
1722
休閒
1122
收藏
755
明星
4419
玩具
1261
美女
931
音樂
7350
旅遊
1041
神秘
1719
配音
494
偶戲
734
動漫
6232
開箱
637
新奇
824
運動
2229
遊戲
9913
電視劇
10255
電影
5366
漫畫
772
綜藝
5628
劇場
1020
廣播
438
趣味
3944
寵物
1657
魔術
2191
教學知識
全部
45322
3C
1527
人物
427
人際
126
心靈
1924
文化
1241
文學
678
生物
160
地理
662
宇宙
390
兒童
1117
兩性
1339
命理
1147
宗教
3697
法律
462
知識
2268
科學
1745
軍武
1239
財經
5794
健康
4040
動物
1885
教育
2381
軟體
1068
植物
299
園藝
2529
演講
312
綜合
1693
歷史
1969
職場
437
雜談
977
藝術
1218
攝影
571
我要推薦
回上一頁
DeepSeek V4发布前,梁文锋连发3篇论文,我读完发现一个规律
1.45萬
2026-01-14
328
AI进化论花生
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
05:11
【AIGC拐点】年终黑马,很强&开源,从生图到数字人...0硬件的自媒体时代真的来了
33:39
AI古装短剧制作教程,抖音热门AI短剧怎么做,AI结合,零基础用chatGPT+promeai+elevenlabs+fliki.ai一步步生成短视频详细流程教学
18:12
Gemini炸裂更新,Nano banana Pro 20個瘋狂應用,YouTube縮圖、IP形象、知識圖解、簡報,中文友好,4K高清(內附免費使用方法)
11:42
粉丝狂飙36万!这种AI短视频为什么最容易爆火?背后的秘密曝光
17:53
我用了上百個AI工具,這32個最好用!AI一人公司必備,10倍提升搞錢效率、AI寫作、提取逐字稿、圖像生成、動畫、剪輯、配字幕、AI數字人、聲音克隆、音樂合成、工作流...
༺ 資料蒐集來源:
YouTube
༻
本站不需註冊加入會員,保障個人隱私,完全不用Cookei