大型语言模型(LLM)为什么处理日语这么“头大”?
引言 你有没有想过,为什么 AI 大神们处理日语时,总是会挠头?其实,这都要从“token”这个神奇的小东西说 […]
引言 你有没有想过,为什么 AI 大神们处理日语时,总是会挠头?其实,这都要从“token”这个神奇的小东西说 […]
语法 以最简单的向量相加为例, 通过把triton翻译成cuda的形式 @triton.jit #需要加这行标 […]
在Phi-3大模型发布之际,我们基于Termux应用,在我的小米手机部署了Phi-3模型:文章地址 Termu […]
最近火山引擎推出了自家联网版的DeepSeekR1,并且加入了联网的功能,不用担心DeepSeek本体的服务器 […]
RAGFlow 部署方式 基于 Docker 部署: 前置条件:需要满足一定的硬件配置,如 CPU ≥ 4 核 […]
0 前言 第一期 AI发展之快令人难以置信,毕竟就在一年前,我们还在为生成正确数量的手指而苦恼 。 过去几年, […]
在所有人都在谈论R1的今天,作为算法也是有些千头万绪无从抓起。所以这一章先复盘,我先按照自己的思路来梳理下R1 […]
0 前言 2025年2月25日,今天发布迄今为止最智能的模型——Claude 3.7 Sonnet,全球首个混 […]
【视频发布】正点原子RK3588开发板本地化部署DeepSeek R1 大模型视频系列视频教程来啦! 一、课程 […]
《DeepSeek提示词工程与落地场景》是由北大计算机人工智能学院、北大青鸟人工智能研究院、北大教育学院学习科 […]
六狼博客 Copyright ©2020 . 6wolf.com
京ICP备14020293号-4
本网站内容均收集于互联网,如有问题请联系QQ:335211818