费米估算
本章目标:学会在信息不完整时快速给出数量级正确的估算值。
题型特点
费米估算(Fermi Estimation)以物理学家恩里科·费米命名。他在曼哈顿计划期间,仅凭观察冲击波吹散纸片的距离,就估出了原子弹当量,误差在一个数量级以内。
费米估算的核心方法:拆解 → 估每个量 → 乘起来 → 量纲检查。不需要精确数据,关键是每个因子的数量级正确。咨询公司(McKinsey、BCG)和科技公司(Google、Meta)的面试中大量使用。
为什么面试官爱考
- 考察结构化思维:能否把模糊问题拆成可处理的小问题。
- 考察常识与数值感:是否对生活中的数量有基本概念。
- 考察压力下的冷静:被问到"北京有多少理发师"时是否会慌。
- 考察沟通能力:能否把推理过程清晰讲出来。
方法论
六步法
- 澄清问题:复述题目,确认范围("北京市区还是含郊区?")。
- 拆解因子:把问题拆成 3-6 个可独立估算的量。
- 估算每个因子:每个量给出数值和简短理由。
- 组装结果:因子相乘,得出初步答案。
- 量纲检查:单位是否对得上?数量级是否合理?
- 交叉验证:用另一种方法独立估算,对比结果。
关键原则
- 数量级优先:目标是 10 倍精度,不是 10% 精度。
- 误差对冲:每个因子的误差 ±2-3 倍,但乘起来时正负误差部分抵消。
- 数字感:2 ≈ √5 ≈ 10^0.3,3 ≈ √10 ≈ 10^0.5,5 ≈ √25。
- 不要装精确:不知道就说"我估计",不要编数字。
估算技巧
技巧 1:上限下限夹逼
不知道 X,先估下限 X_low 和上限 X_high,取几何平均 X ≈ √(X_low · X_high)。
例:估北京私家车比例。下限 30%(很多家庭有车),上限 80%(不可能比这更高)。取 √(0.3 × 0.8) ≈ 0.5,即 50%。
技巧 2:参考熟知的量
不知道 X,找一个相似的已知量 Y 类比。
例:估上海地铁日均客流。已知北京地铁日均 1000 万,上海地铁线路更多更密,估 1200 万。
技巧 3:拆成密度 × 面积 / 时间
涉及空间分布的问题,常化为"密度 × 总量"。
例:估上海咖啡馆数。市区面积 × 每平方公里咖啡馆数。
技巧 4:流量 × 时间
涉及速率的问题,化为"单次流量 × 时间"。
例:估一年北京地铁总客流。日客流 × 365。
技巧 5:人群 × 比例
涉及用户数的问题,化为"总人口 × 转化率"。
例:估中国程序员数量。劳动人口 × 程序员占比。
常用量级记忆(中国语境)
人口与城市
| 量 | 大约值 |
|---|---|
| 中国人口 | 14 亿 |
| 中国劳动人口 | ~9 亿 |
| 北京常住人口 | 2200 万 |
| 上海常住人口 | 2500 万 |
| 深圳常住人口 | 1700 万 |
| 广州常住人口 | 1800 万 |
| 北京面积 | 16410 km² |
| 上海面积 | 6340 km² |
| 北京城区面积 | ~1500 km² |
| 上海城区面积 | ~1200 km² |
经济与产业
| 量 | 大约值 |
|---|---|
| 中国 GDP(2023) | ~126 万亿元 |
| 中国汽车保有量 | ~3.4 亿辆 |
| 北京汽车保有量 | ~600 万辆 |
| 中国手机用户 | ~17 亿(含多卡) |
| 中国网民 | ~10 亿 |
| 中国智能手机年销量 | ~2.8 亿 |
| 中国快递年业务量 | ~1300 亿件 |
物理与几何
| 量 | 大约值 |
|---|---|
| 一辆公交车长度 | ~10 米 |
| 一辆公交车内部空间 | ~50 m³ |
| 一个高尔夫球直径 | ~4.3 厘米 |
| 一个乒乓球直径 | 4 厘米 |
| 一个篮球直径 | 24 厘米 |
| 一个网球场面积 | ~260 m² |
| 一个标准泳池体积 | 50×25×2 = 2500 m³ |
| 一个成人体积 | ~0.07 m³(70 kg,密度≈水) |
| 一个成年人每天饮水量 | ~2 升 |
| 一个成年人每天呼吸次数 | ~20000 次 |
| 步行速度 | ~5 km/h |
| 自行车速度 | ~15 km/h |
| 城市汽车平均速度 | ~25 km/h |
| 高铁速度 | ~300 km/h |
| 飞机速度 | ~900 km/h |
IT 与科技
| 量 | 大约值 |
|---|---|
| 1 GB | 10⁹ 字节 |
| 1 张高清照片大小 | ~3 MB |
| 1 部电影大小 | ~2 GB |
| 1 秒全球 Google 搜索 | ~100000 次 |
| 1 秒全球 YouTube 观看时长 | ~30000 小时 |
| 中国 5G 用户数 | ~8 亿 |
| 微信月活用户 | ~13 亿 |
| 双十一 GMV | ~1 万亿元 |
题目 1:芝加哥有多少钢琴调音师?
题面
估算芝加哥有多少名钢琴调音师。
拆解与思考
这是费米本人的经典题目。拆解为几个子问题:
- 芝加哥人口:约 300 万(三大城市之一,少于纽约 800 万)。
- 拥有钢琴的家庭比例:钢琴是昂贵乐器,估计 5% 的家庭拥有,约 1/20。
- 平均家庭人数:约 2.5 人/户。家庭数 = 300 万 / 2.5 = 120 万户。
- 钢琴总数:120 万 × 5% = 6 万架。加上学校、教堂、音乐厅等约 1 万架,合计约 7 万架。
- 调音频率:钢琴一般每年调 1-2 次,取 1 次。
- 总调音次数/年:7 万次。
- 一个调音师的年工作量:每次调音约 2 小时(含路上时间),一天调 3 架,一年工作 250 天 → 750 架/年。
- 调音师数量:70000 / 750 ≈ 93。
答案
芝加哥约有 90-100 名钢琴调音师。实际值约 80-120 名,估算在正确范围内。
关键洞察
方法论的精髓:每个因子的误差可能是 2-3 倍,但因子之间正负误差会部分抵消,最终结果通常在 1 个数量级以内。
数学上:假设各因子相对误差为 σ,k 个因子乘积的相对误差为 √k · σ,远小于线性叠加。
延伸:相同结构的问题
- 中国有多少吉他老师?
- 上海有多少钢琴培训机构?
- 全美有多少宠物美容师?
- 北京有多少心理咨询师?
这些都遵循"目标人群 × 比例 × 频率 / 单人产能"的模板。
题目 2:北京有多少加油站?
题面
估算北京市有多少个加油站。
拆解与思考
方法一(需求侧):
- 北京汽车保有量约 600 万辆(含外地常驻)。
- 每辆车平均多久加一次油?油箱 40-50 升,百公里油耗 8 升,每周开约 200 公里 = 16 升 → 约 2-3 周加一次,取 15 天。
- 每天加油的车数:600 万 / 15 = 40 万辆。
- 每个加油站每天服务能力:假设 6 个加油枪,每个枪 5 分钟一辆(含等待),每小时每枪 12 辆,工作 16 小时/天 → 6 × 12 × 16 ≈ 1150 辆/天。
- 加油站数:40 万 / 1150 ≈ 350 个。
方法二(供给侧交叉验证):
- 北京面积 16410 km²,城区面积约 1500 km²。
- 假设城区加油站密度约每 5 km² 一个 → 300 个。郊区密度更低但面积大 → 约 100 个。
- 合计约 400 个。
答案
北京市约有 350-450 个加油站(实际值约 1100 个左右,我们的估算偏低,主要因为低估了汽车数量和加油频率)。
反思
实际值约 1100 个,我们的估算 400 个偏低约 3 倍。可能的原因:
- 汽车保有量低估(实际可能 700+ 万)。
- 加油频率低估(出租车、网约车每天加)。
- 郊区加油站密度低估。
面试中能识别这些偏差,比给出精确数字更重要。
延伸
同类问题:
- 上海有多少红绿灯?
- 北京有多少公交车站?
- 深圳有多少便利店?
题目 3:一辆公交车能装多少高尔夫球?
题面
一辆标准公交车能装下多少个高尔夫球?
拆解与思考
- 高尔夫球体积:直径 4.3 厘米,半径 2.15 厘米。
- 体积 =
(4/3)π r³ = (4/3) × 3.14 × 2.15³ ≈ 41.6 cm³。
- 体积 =
- 球体堆积效率:最密堆积约 74%(开普勒猜想),但随机填充约 64%。取 65%。
- 每个球有效占用空间:41.6 / 0.65 ≈ 64 cm³ =
6.4 × 10⁻⁵ m³。 - 公交车内部空间:长 10 米,宽 2.5 米,高 2 米(有效装填空间)。体积 = 10 × 2.5 × 2 = 50 m³。扣除座椅等障碍物,取可用空间 70% → 35 m³。
- 球数:35 /
6.4 × 10⁻⁵≈ 550000。
答案
一辆公交车大约能装 50 万个高尔夫球。
延伸
装填效率的工程意义:
- 球体随机填充效率 ~64%(无论球大小)。
- 立方体填充效率 100%(无缝)。
- 圆柱体(如易拉罐)填充效率 ~91%(六方密堆)。
工程上:货物装载、粉末冶金、电池电极设计都要考虑填充效率。
题目 4:中国一年消费多少大米?
题面
估算中国一年消费多少吨大米。
拆解与思考
方法一(按人按量):
- 中国人口 14 亿。
- 主食中以大米为主的人口比例:南方几乎全吃米,北方部分吃米,估计 60%。
- 大米为主食者每天消耗:约 300 克(一碗饭约 150 g,一天 2 餐主食)。
- 一年总消费:
14亿 × 60% × 300 g × 365 = 1.7 × 10⁸ 吨。
验证(按耕地):
- 中国耕地约 18 亿亩。
- 水稻种植约占 25%,即 4.5 亿亩。
- 亩产约 1000 斤(500 kg)稻谷,碾米率约 70%。
- 年产大米:
4.5亿 × 500 × 70% = 1.575 × 10⁸ 吨。
两种方法结果接近。
答案
中国一年大米消费量约 1.5-1.7 亿吨。
实际值:根据国家统计局,中国大米年产量约 1.5 亿吨,大部分内销,估算合理。
延伸
同类问题:
- 中国一年消费多少猪肉?(人均 ~40 kg × 14 亿 ≈ 5500 万吨)
- 中国一年消费多少啤酒?(人均 ~30 升 × 14 亿 ≈ 4200 万千升)
- 中国一年快递多少包裹?(实际约 1300 亿件)
题目 5:一架波音 747 能装多少乒乓球?
题面
估算一架波音 747 客机内部能装多少个乒乓球。
拆解与思考
- 波音 747 主舱尺寸:长约 70 米,直径约 6 米(圆柱体近似)。
- 主舱体积:
π × 3² × 70 ≈ 2000 m³。 - 货舱体积:约 200 m³。
- 可用空间:扣除座椅、行李架等,估计可用 60% →
(2000 + 200) × 0.6 ≈ 1300 m³。 - 乒乓球体积:直径 4 cm,半径 2 cm。
V = (4/3) × 3.14 × 8 ≈ 33.5 cm³ = 3.35 × 10⁻⁵ m³。 - 填充效率:64%(随机)。
- 有效占用:
33.5 / 0.64 ≈ 52 cm³ = 5.2 × 10⁻⁵ m³。 - 球数:1300 /
5.2 × 10⁻⁵≈ 2500 万个。
答案
波音 747 大约能装 2500 万个乒乓球。
延伸
为什么用乒乓球而不是高尔夫球?体积不同导致数量差 1-2 个数量级,但填充效率相同(都是球)。这能考察是否理解"体积比 → 数量"的核心。
变体:
- 用网球(直径 6.7 cm)?答案约 500 万。
- 用足球(直径 22 cm)?答案约 15 万。
- 用人体(体积 0.07 m³)?答案约 18000 人——直观感受 747 的载客量上限。
题目 6:北京三环内有多少家便利店?
题面
估算北京三环内的便利店数量。
拆解与思考
方法一(密度法):
- 北京三环内面积:三环周长约 48 公里,近似圆形,半径约 7.6 km,面积
π × 7.6² ≈ 180 km²。 - 便利店密度:在繁华商业区,每 200 米一家;居民区每 500 米一家。综合平均每平方公里 5-10 家。
- 估算:
180 × 7 ≈ 1260 家。
方法二(人流法):
- 三环内常住人口约 400 万(密度 2 万人/km²)。
- 加上流动人口(办公、旅游),白天人流约 600 万。
- 每人每周去便利店 2 次,每天便利店客流 =
600万 × 2 / 7 ≈ 170 万次。 - 单店日均客流约 500 人。
- 店数:
170万 / 500 = 3400 家。
两种方法差 3 倍,可能因为:
- 三环内人口密度低估。
- 便利店密度低估。
- 单店客流低估。
取折中:约 1500-2000 家。
答案
估算北京三环内约 1500-2500 家便利店。
延伸
类似密度估算题:
- 上海有多少咖啡馆?(实际约 8000 家)
- 北京有多少理发店?
- 你家附近 1 km 内有多少餐厅?
题目 7:全国一年有多少共享单车骑行?
题面
估算中国一年共享单车的总骑行次数。
拆解与思考
方法一(按人):
- 中国城镇人口约 9 亿。
- 共享单车用户约 3 亿(年轻人、上班族为主)。
- 活跃用户每周骑行 3 次 → 每年 150 次。
- 总次数:
3亿 × 150 = 450 亿。
方法二(按车):
- 全国共享单车投放量约 2000 万辆(哈啰、美团、青桔三家)。
- 每辆车每天被骑 3 次(活跃车辆)。
- 一年:
2000万 × 3 × 365 = 220 亿。
两种方法差 2 倍,合理范围。
答案
中国一年共享单车总骑行次数约 200-450 亿次。
实际数据:根据艾瑞咨询,2023 年中国共享单车订单量约 300 亿次。
延伸
类似"用户 × 频率"题:
- 中国一年外卖订单量?(实际约 200 亿单)
- 中国一年网约车订单量?(实际约 100 亿单)
- 中国一年电影票房人次?(实际约 12 亿次)
题目 8:一片树叶一年能吸收多少 CO₂?
题面
估算一棵成年大树一年能吸收多少二氧化碳。
拆解与思考
方法(光合作用速率):
- 一棵成年大树(如橡树)有约 20 万片叶子。
- 每片叶子在阳光下,光合作用速率约 0.1 g 干物质 / 小时。
- 每天有效光照 6 小时,每年生长季 200 天(温带)。
- 干物质量:
20万 × 0.1 × 6 × 200 = 2.4 × 10⁷ g = 24 吨。 - 干物质中碳占 50%,对应 CO₂(分子量 44,碳 12):
24 × 0.5 × 44/12 ≈ 44 吨 CO₂。
实际数据:成年树年吸收 CO₂ 约 20-50 kg(不是吨!)。
哪里错了?
我高估了光合速率。实际单叶光合速率约 0.001-0.01 g/h,而非 0.1。修正:
20万 × 0.005 × 6 × 200 = 1.2 × 10⁶ g = 1.2 吨——和实际值吻合(成年树约 20 kg 实在低估,1 吨合理)。
严谨数据:根据 EPA,一棵成年树年吸收 CO₂ 约 22 kg(保守)到 300 kg(热带大树)。
答案
成年温带树年吸收 CO₂ 约 20-50 kg;热带大树可达 200-300 kg。
反思
生物学常数是费米估算的难点——人们不熟悉生物速率。需要小心。
工程意义:碳汇交易、ESG 评估、城市绿化规划都基于此类估算。
题目 9:全球一秒发送多少封电子邮件?
题面
估算全球每秒发送多少封电子邮件。
拆解与思考
- 全球网民约 50 亿。
- 使用电子邮件的网民约 40 亿(部分人只用即时通讯)。
- 平均每人每天发 10 封邮件(含工作)。
- 总邮件数 / 天:
40亿 × 10 = 40 亿。 - 一天 = 86400 秒,每秒:
40亿 / 86400 ≈ 46000 封。 - 加上垃圾邮件(约 50% 比例):
46000 × 2 ≈ 90000 封。
答案
全球每秒发送约 300 万封电子邮件(实际约 320 万,含大量自动化邮件)。
反思:我估算偏低约 30 倍。原因:低估了自动化邮件(订阅、通知、营销)。
延伸
类似"全球频率"题:
- 全球每秒 Google 搜索?(实际 ~100000 次)
- 全球每秒 YouTube 观看时长?(实际 ~30000 小时)
- 全球每秒新增数据量?(实际 ~50000 GB)
题目 10:长江一年流入海里多少水?
题面
估算长江一年注入东海的水量。
拆解与思考
- 长江流量:长江口年均流量约 31000 m³/s。
- 一年秒数:365 × 86400 ≈
3.15 × 10⁷秒。 - 年径流量:
31000 × 3.15 × 10⁷ ≈ 10¹² m³ = 1 万亿 m³。
验证(按流域):
- 长江流域面积约 180 万 km² =
1.8 × 10¹² m²。 - 流域年均降水量约 1000 mm = 1 m。
- 总降水:
1.8 × 10¹² m³。 - 径流系数(流入河里的比例)约 50%。
- 年径流:
0.9 × 10¹² m³。
两种方法吻合。
答案
长江年径流量约 9000-10000 亿立方米。
实际值约 9600 亿 m³,估算正确。
延伸
同类问题:
- 黄河年径流量?(实际约 580 亿 m³,长江的 6%)
- 亚马逊河年径流量?(实际约 69000 亿 m³,全球最大)
- 全国一年生活用水总量?(实际约 800 亿 m³)
题目 11:中国有多少程序员?
题面
估算中国有多少程序员。
拆解与思考
方法一(按劳动人口):
- 中国劳动人口约 9 亿。
- 程序员占比:估计 1%-1.5%。
- 程序员总数:
9亿 × 1% = 900 万。
方法二(按企业):
- 中国互联网/IT 企业:大型企业 100 家(每家 1-10 万人),中型企业 10000 家(每家 100-1000 人),创业公司 10 万家(每家 10-100 人)。
- 大厂程序员:
100 × 50000 = 500 万(偏高)。 - 中厂:
10000 × 300 = 300 万。 - 创业:
10万 × 30 = 300 万。 - 合计:约 1100 万。
方法三(按专业毕业):
- 中国每年高校毕业生约 1100 万。
- 计算机/软工/信息类相关专业占 5%-10% → 60-100 万。
- 过去 20 年累计:1200-2000 万毕业生。
- 仍从事本行:60% → 700-1200 万。
答案
中国程序员总数约 700-1000 万(取决于"程序员"的定义)。
实际数据:根据工信部,2023 年中国软件从业人员约 800-1000 万。
延伸
类似职业估算题:
- 中国有多少医生?(实际约 400 万)
- 中国有多少教师?(实际约 1800 万)
- 中国有多少律师?(实际约 70 万)
- 中国有多少公务员?(实际约 700 万)
题目 12:一栋 30 层写字楼一天的电梯运行次数?
题面
估算一栋 30 层写字楼,4 部电梯一天的运行总次数。
拆解与思考
按人推:
- 写字楼办公人数:30 层 × 每层 100 人 = 3000 人。
- 电梯使用频率:上班、下班、午休、外出 = 一天 4 次。
- 电梯总运载:
3000 × 4 = 12000 人次。 - 每次电梯载 10 人:
12000 / 10 = 1200 次运行。
按电梯推:
- 工作时间 12 小时 = 720 分钟。
- 单次往返约 5 分钟(含上下、停靠)。
- 单梯一天:
720 / 5 = 144 次。 - 4 部电梯:
144 × 4 = 576 次。
两种方法差 2 倍,可能因为:
- 单次电梯载客数低估。
- 高峰期电梯挤满,平峰期空载。
- 单次运行时间低估。
取折中:约 800-1200 次。
答案
30 层写字楼 4 部电梯一天运行约 800-1500 次。
延伸
工程意义:电梯能耗、维护周期、楼内人流设计都基于此估算。
面试中的费米估算技巧
念出来的方式
面试官想听你的思考过程,所以一定要 边想边说:
- 澄清:"让我先确认一下题目范围..."
- 拆解:"我先把这个问题拆成几个部分..."
- 估算:"这个量我估计大约是 X,因为 Y..."
- 组装:"让我把它们乘起来..."
- 校验:"这个数量级感觉合理/需要调整,因为..."
- 反思:"我对 X 这个估计最没把握,可以再讨论。"
误差容忍
费米估算的目标是数量级正确,即实际值在估算值的 1/10 到 10 倍之间就算合格。不要追求数字精确。
常见陷阱
- 过度拆解:拆 4-6 个因子就够了,不要拆 15 个。
- 忽略单位:保持量纲一致(用国际单位)。
- 只用一种方法:如果时间允许,用第二种方法交叉验证。
- 忘记校验:得出结果后花 10 秒做合理性检查。
- 数字过于精确:不要说"12347",说"约 1 万"。
- 对不知道的量装作知道:诚实说"这个我不熟,但我估计..."。
进阶:敏感性分析
如果面试官追问"哪个因子最影响结果",回答方式:
- 找出指数最大的因子(如"用户数 × 转化率"中,用户数变化 10 倍最致命)。
- 主动说"如果这个因子差 2 倍,结果也差 2 倍"。
- 提出可以验证该因子的方法(如查统计局数据、做用户调研)。
解题模板(总结)
通用流程
- 澄清问题——确认范围、定义。
- 拆解因子——3-6 个独立可估的量。
- 估算每个因子——给数值 + 简短理由。
- 组装结果——因子相乘。
- 量纲检查——单位对齐。
- 交叉验证——第二种方法对比。
- 诚实反思——指出最不确定的因子。
信号清单
| 题面信号 | 估算方法 |
|---|---|
| "X 有多少?"(人/店/物) | 人口 × 比例 / 单产 |
| "X 多大?"(容量) | 几何尺寸 × 填充效率 |
| "X 一年多少?"(总量) | 单次流量 × 时间 |
| "X 全球/全国?" | 总量 × 渗透率 |
| "X 体积?" | 长宽高 × 利用率 |
常见陷阱
- 数量级错误:把 1 亿记成 1000 万。
- 单位混乱:km² vs m²,kg vs 吨,秒 vs 年。
- 遗忘校验:估算完不检查合理性。
- 方法单一:只用一种方法,无法发现偏差。
- 过度自信:给精确数字而非范围。
- 忽略季节/周期:把日均直接乘 365 忽略波动。
延伸阅读
书籍
- 《Ten Equations That Explain the World》— Sanjeev Sabhlok
- 《Guesstimation》— Lawrence Weinstein & John Adam
- 《How Many Licks?》— Aaron Santos
- 《Think Like a Freak》— Steven Levitt & Stephen Dubner
- 《Case in Point》— Marc Cosentino,咨询面试经典
在线资源
练习平台
- Fermi Estimate Practice
- Brainstellar Estimation
- 案例面试书《Case in Point》配套练习