Add HF bshada/open-schematics to Phase 1 plan

Why:
- Charles 点名把该 HF 数据集纳入第一批。它是已预处理包(非待爬网站),
  和 oshwhub 的抓取逻辑不一样,先把决策面在 plan 里讲清楚,再动手拉。
- 与 oshwhub (EasyEDA 生态) 互补,补 KiCad 原生路径。

What:
- docs/sources/hf_bshada_open_schematics.md: 调研文档
  - 78 parquet shards, 6.4 GB 总量
  - CC-BY-4.0 商用友好
  - 字段:.kicad_sch 源 / PNG / 组件列表 / JSON / YAML / name / desc
  - 镜像方案(整包存 data/external/..., 不拆 per-project)
  - .gitattributes 建议(data/external/**/*.{parquet,png} → LFS)
- plan.md §1.5: 阶段说明 + 待 Charles 批 6.4 GB 预算
- README.md 数据源表: 加一行
- log.md: 本次记录

下载未触发,等 Charles 拍板。

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
Zhang Jiahao
2026-04-23 19:51:24 +08:00
parent ce22717288
commit 53b7648984
4 changed files with 154 additions and 3 deletions

View File

@@ -14,7 +14,8 @@
| 站点 | URL | 覆盖 | 许可 | 抓取复杂度 |
|------|-----|------|------|-----------|
| 立创开源平台 | oshwhub.com | 国内 PCB/EDA 设计 ~百万量级 | 多为 CC-BY-SA / 作者自定 | 中SPA需 API 逆向) |
| 立创开源平台 | oshwhub.com | 国内 PCB/EDA 设计 ~12K 精品 | 多为 GPL 3.0 / Public Domain / CC-BY-SA | 中SPA需 API 逆向) |
| **HF** `bshada/open-schematics` | huggingface.co | 10K+ KiCad 已预处理 schematics | CC-BY-4.0 | 极低(整包镜像) |
| 嘉立创 EDA 样例 | lceda.cn/example | 官方示例 | 开放 | 低 |
| Hackaday.io | hackaday.io | 项目叙事 + 文件 | 作者自定 | 中 |
| GitHub | github.com | KiCad/EasyEDA repo | 各 repo 自定 | 低gh API |