爱豆吧!
open-menu closeme
Home
随笔
Speeches
My Books
About
🌐
English Português
  • 云原生工程师入坑AI深度学习系列(二):给昌子解释DeepSeek的模型蒸馏

    calendar Feb 7, 2025 · 3 min read · AI 深度学习 神经网络 模型蒸馏 云原生 DeepSeek  ·
    Share on: twitter facebook linkedin copy

    背景 一篇技术入门文章,尝试向非领域技术人员介绍DeepSeek的模型蒸馏。先求易懂,再求准确。起因是昨天,正月初七,昌子突然微信问我“DeepSeek咋用”。回复“你不好好焊钢轨,打听这玩意儿干啥”。小哥说我就想闹明白我们中国这个技术是不是像有些短视频里说的抄了老美的。不用问,这小哥是过年在家闲的刷到OpenAI可能起诉DeepSeek的新闻了。虽然给他说Altman在咱们大年初六好已经承认不打算起诉了,但是说服昌子小哥还是费了不少口舌。为了说明没有抄,模型蒸馏的话题就绕不过。在沟通中临时起意提到小哥咱们很多年前的一段趣事,居然说明白了。觉得很有意思,就顺手归档下。 模型蒸馏概念初体验 首先,DeepSeek关于模型蒸馏的定义是这 …


    Read More
  • 云原生工程师入坑AI深度学习系列(一):从线性回归入门神经网络

    calendar Oct 6, 2024 · 3 min read · AI 深度学习 神经网络 Linear regression 云原生  ·
    Share on: twitter facebook linkedin copy

    背景 最近团队的业务除了面向通用计算外,越来越多的要处理面向AI场景的软硬件资源的供给、分发、调度等。虽然还是在熟悉的云原生领域,折腾的还是哪些对象哪些事儿,适配到一种新场景。但为了避免新瓶装老酒,能有机会做的更扎实,做出价值,对这个要服务领域内的一些东西也想花点时间和精力稍微了解下。 国庆长假环太湖一圈回来,假期最后这两天豆哥被要求上课,正好难得集中时间可以稍微看些东西。暂时没有精力系统地构建,先入个门。作为一个云原生领域的从业者,目标是知道容器里跑的是什么,怎么跑的。 学新东西时习惯用自己的文字,尽可能简单易懂地总结记录贯通下,做不到严谨、全面、深入、专业。开始前定个小目标只要做到基本的通、透、够用即可。 说干就干,先从深度学习 …


    Read More

Recent Posts

  • 云原生工程师入坑AI深度学习系列(二):给昌子解释DeepSeek的模型蒸馏
  • 今天起,我就成了您
  • 云原生工程师入坑AI深度学习系列(一):从线性回归入门神经网络
  • 豆哥国庆环太湖Day5:西山岛(苏州-太湖-杭州)
  • 豆哥国庆环太湖Day4:渔洋山(常州-太湖-苏州)
  • 豆哥国庆环太湖Day3:恐龙园(常州-常州-常州)
  • 豆哥国庆环太湖Day2:三国城(宜兴-无锡-常州)
  • 豆哥国庆环太湖Day1:遇太湖(杭州-湖州-宜兴)

Categories

ISTIO 45 服务网格 44 随笔 23 图书 17 ENVOY 16 HADOOP 12 ISTIO权威指南 11 演讲 10 数据库 7 豆哥 7 云原生服务网格ISTIO原理实践架构与源码解析 6 发表 6 机器学习 5 JAVA 4
All Categories
AI2 ENVOY16 GOLANG3 HADOOP12 ISTIO45 ISTIOCON3 ISTIO权威指南11 JAVA4 JVM1 KARMADA1 KUBECON4 KUBERNETES3 SERVICEMESHCON1 云原生2 云原生服务网格ISTIO原理实践架构与源码解析6 分类2 发表6 图书17 并发3 数据库7 服务网格44 机器学习5 演讲10 父亲1 神经网络2 聚类1 豆哥7 铁路1 随笔23
[A~Z][0~9]

Tags

ISTIO 44 服务网格 43 演讲 24 KUBECON 20 随笔 20 JAVA 18 最佳实践 18 图书 17 ENVOY 16 RESPONSEFLAGS 16 访问日志 16 HADOOP 12 MAPREDUCE 12 源码 12
All Tags
123061 AI2 AQS1 AUTHORIZATIONPOLICY1 CERT-MANAGER1 DC2 DEEPSEEK1 DI1 DPE1 ENGLISH1 ENVOY16 EXECUTOR2 FI1 G201 GOLANG3 GRE1 HADOOP12 INFOQ3 ISTIO44 ISTIOCON3 ISTIO权威指南11 JAPANESE1 JAVA18 JVM1 K-MEDOIDS1 KARMADA1 KUBECON20 KUBERNETES3 LINEAR-REGRESSION1 MAPREDUCE12 NC1 NR1 ORACLE3 PILOT2 RESPONSEFLAGS16 RL2 SERVICEENTRY1 SERVICEMESHCON1 SPRING-CLOUD1 SPRINGCLOUD1 UC1 UF1 UH1 UPE1 URX1 UT1 にほんご1 事务1 云原生2 云原生服务网格ISTIO原理实践架构与源码解析6 信2 军训2 分类2 发表1 国际米兰1 图书17 垃圾回收1 多集群2 太湖5 安全2 并发3 微服务1 执行计划1 数据库1 新冠1 旅游5 日语1 昌子1 最佳实践18 服务网格43 机器学习2 案例4 模型蒸馏1 深度学习2 源码12 演讲24 父亲1 祖母2 神经网络2 程序员3 索引3 聚类1 表连接1 西安1 访问日志16 语言6 调用链2 豆哥10 足球1 铁路2 随笔20 韧性1
[A~Z][0~9]
浙ICP备18050493号-1 浙公网安备 33010802006262号

Copyright  浙ICP备18050493号-1 浙公网安备 33010802006262号. All Rights Reserved

to-top