我对 Hugging Face 的理解(2022.05)

Hugging Face(简称 HF)完成了 C 轮 1 亿美元的融资,估值达到了 20 亿美元。关注 HF 也有一段时间了,以下是我的理解。

GitHub for models

HF 从 PyTorch 版本的 Bert 开源模型起家,之前一直想做 GitHub for models。但实际呈现出来的效果基本是一个 model zoo(模型商店),一般情况下就是简单的模型上传分享与下载。问题在于用户很难在 model 上面做 fork 后的二次开发。如果 GitHub 只有一个 git clone 命令,那也就和古早的 SourceForge 分享代码没有什么区别了。

GitHub for pipelines

现在 HF 开始做 Spaces,可以理解为 GitHub for pipelines。相比于 model,pipeline 确实有 fork 后进行二次开发的空间。不过这条路上已经有了不少的玩家,比如Google Colab,Snowflake 收购的 Streamlit,Databricks 收购的 8080 labs,以及其它一些 notebook as a service 的玩家。

BigScience

HF 在训练 BigScience 大模型(1760 亿参数),对标 OpenAI 的 GPT-3。不过前两天 Meta 率先开源了 OPT 大模型也是对标 GPT-3,抢了这波风头。但我觉得这个对 HF 应该没有什么实际影响。HF 希望通过 BigScience+Spaces 来提供更加完整的 AI 能力。如果做成了,那么会比 OpenAI 提供的服务更完整。

目前业界比较公认大模型的价值,对 HF 来说最大的不确定性是 Spaces 能否成功,GitHub for pipelines 是否成立?要弄明白这个问题,我们需要深入思考一下 GitHub 究竟做对了什么。