本系列会赓续用喜闻乐见的说话潜入浅出为小白先容AI常识,尤其是频年火起来的大模子、AIGC、Agent等内容,本章节内容尝试用生涯中的场景证实一下使用大模子要热心的“token”。
01 Token是什么?
大模子感知寰宇的元素
Token是大说话模子措置文本的最小信息单元,特殊于模子相识寰宇的“基本构件”。当模子措置输入时,文本分解过分词器(Tokenizer)被切割成一系列Token,这些Token不错是单词、子词或字符,举例中语的“东说念主工智能”可能被拆分为“东说念主工/智能”或“东说念主/工/智能”。
烹调的基础原料
念念象你是一位大厨(大说话模子),准备烹调一桌菜肴(措置一段文本):
token即是你烹调时需要加工的一个个基础食材,包括原材料、调料等系数需要的元素,你行为大厨将眼前的原材料证据你的训诲制作出丰盛的菜肴,也即是不同智力大模子的输出经过。
会推理的大模子还会一步步告诉你他为什么这么烹调。
02 落魄文窗口是什么?
大模子感知寰宇的限制
落魄文窗口(Context Window)是大说话模子在一次措置中能同期“看见”的最大文本限制,特殊于模子的职责操心容量。它以Token数目为计量单元(举例deepseek-r1的 64k Token),决定了模子能连贯分析多长的对话、文档或代码。
要道特质:
动态滑动:模子像阅读时用荧光笔划要点,每次生成新内容时,窗口会滑动聚焦最新信息(访佛东说念主类短期操心机制);
硬性末端:普及窗口容量的内容会被“淡忘”(举例措置一册300页的演义时,模子只可记着终末几页内容);
效果瓶颈:窗口越大,模子计较本钱指数级增长(举例窗口从4k扩张到32k,计较量可能加多60倍)。
烹调的容器空间
念念象你是一位厨师(大说话模子),正在用一口锅(落魄文窗口)炖煮食材(文本Token):
锅的大小决定一锅能炖若干菜:
4k容量锅(GPT-3):特殊于家庭炒锅,最多同期炖4公斤食材(4096 Token)。
32k容量锅(GPT-4):升级为商用汤桶,能措置32公斤食材(约5万字中语)。
128k超大锅(kimi-128k):工业级蒸箱,可措置整头牛(10万Token=15万字)。
当食材普及锅容量时:
告成溢出:早期食材被丢弃(模子淡忘前文),导致菜品失去档次感(对话逻辑断裂);
分批炖煮:先炖前半锅,盛出后再炖后半锅,但汤汁(落魄文连贯性)无法分解;
浓缩高汤:提前将食材熬成浓缩汁(文本纲目),但可能丢失细节风度(要道信息缺失)。
对话案例:厨房烹调危境
案例:用户连接发问20个问题,累计滥用3800 Token,此时模子锅具(4k窗口)已塞满。当用户问第21个问题时:
不幸现场:模子被动丢弃前5个问题的“食材”,导致恢复出现“您之前提到的XX是指什么?”;
6轮过后,国足距离第二的澳大利亚只差1分,迪士尼彩乐园最新并且跟印尼、沙特、巴林只是相差净胜球,所以国足真的有希望争二直接出线,就看最后四场的表现如何。
而在国家队方面,分别要在明年的三月份和六月份迎来4场18强赛的比赛!这三项赛事涵盖了成年国家队、国青队到国少队三个不同的年龄段,都是非常值得期待的赛事。
专科粗犷:自动触发“分锅”机制,将对话拆分为“前10问”和“后11问”两锅孤苦措置,但两锅菜品可能调味不一致(恢复作风大概细节可能不连贯有幻觉)。
烹调提倡:
点菜前看锅型:了解模子的窗口大小(如kimi不错达到128k),幸免超量点单;
实时收汁:长对话中依期归来(“刻下商议要点:1…2…”),如同撇去浮沫保留精华。
相识落魄文窗口,就像掌捏不同锅具的烹调特质——用砂锅慢炖玄学问题,拿铁锅爆炒代码调试,这才是独霸大模子的火候精髓
03 为什么用token计费?
大模子管事按照资源滥用订价
大模子管事按Token计费的本体是资源滥用订价,其背后依赖三大时期旨趣:计较量 ≈ 模子参数目 × N × 层数
内存占用随落魄文窗口增长,措置长文本时,模子的戒备力机制需存储系数Token的键值对(KV Cache),内存占用 ≈ 2×维度×层数×Token数
角落本钱非线性增长,Token数目与推理时期呈分段线性干系
餐厅按照食材计量收费
念念象你谈论一家餐厅,顾主(用户)点餐(发问)时需要考虑以下本钱结构:
食材数目与燃气滥用的干系
炒菜火候:每个Token如同食材块,需要在大厨(GPU)的烈火灶上翻炒(计较)。
燃料账单:炒10块鸡肉(10 Token)滥用1单元燃气,100块则可能滥用15单元。
特制灶具:措置长文本需启用压力锅(高显存GPU),时租$3/小时,即便只炖1块萝卜也要开机
如斯一来,顾主念念吃的食品多,烹调耗时复杂,当然本钱更高。
若是是包年包月,用户告成发问一册红楼梦(只吃三文鱼),很容易本钱扛不住
题图来自Unsplash,基于CC0公约
该文不雅点仅代表作家本东说念主迪士尼极速时时彩乐园,东说念主东说念主王人是产物司理平台仅提供信息存储空间管事