Add schema+file validator; pin down fs-web-stream as ad icons
Why: - schema 必须能自动校验,否则后续放量无法防腐。现在 scripts/validate.py 对全部 metadata.json 做两层检查(schema + 本地文件 sha256),跑一次 即可对全量数据签收;10/10 项目已通过。 - docs/sources/oshwhub.md 之前把 fs-web-stream.jlc.com 标为"工程源待查", 排查后确认那些 URL 全部是嘉立创服务侧栏/推广图标,与项目无关。 image.lceda.cn/attachments/ 是项目附件的唯一入口,现在调研文档闭合。 What: - scripts/validate.py: jsonschema 校验 + optional --check-files 核 sha256 - pyproject.toml: 加 jsonschema>=4.26 依赖 - docs/sources/oshwhub.md: fs-web-stream 归类为推广资源(已排除),附 context 证据 - log.md: 本次会话记录 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
31
log.md
31
log.md
@@ -56,8 +56,35 @@
|
||||
|
||||
1. 验收 10 个项目元数据质量(随机抽 2-3 条对照原站)
|
||||
2. 决定 Phase 1.4 放量目标(50?500?全量 12493?)
|
||||
3. 未解决:`fs-web-stream.jlc.com` 下载(工程源?)、`u.lceda.cn` 登录态抓工程 JSON
|
||||
4. Phase 2 准备:GitHub KiCad repo 调研
|
||||
3. Phase 2 准备:GitHub KiCad repo 调研
|
||||
|
||||
---
|
||||
|
||||
## 2026-04-23 19:40 fs-web-stream 排查 + schema 自动校验
|
||||
|
||||
**Claude 会话**(自主推进)
|
||||
|
||||
### fs-web-stream.jlc.com 定性
|
||||
|
||||
重新抓 `/CYIIOT/ST_LINK-V2_1` 并看 13 个 `fs-web-stream.jlc.com` 链接的上下文:全部是嘉立创服务侧栏/推广图标(3D 打印、发热片、Ican、EDA 扩展广场、开源硬件平台 badge 等),**与项目本身无关**。`image.lceda.cn/attachments/` 就是项目附件的唯一入口,已确认闭环。`docs/sources/oshwhub.md` 对应章节已更新。
|
||||
|
||||
### scripts/validate.py
|
||||
|
||||
jsonschema 做两层校验:
|
||||
- 默认:所有 `data/raw/**/metadata.json` 对 `schemas/project.schema.json` 的结构校验
|
||||
- `--check-files`:另外验证每条 file 的本地 path 存在且 sha256 匹配
|
||||
|
||||
**结果**:10/10 项目两项全通过。
|
||||
|
||||
### 新增
|
||||
|
||||
- `scripts/validate.py`
|
||||
- `pyproject.toml` 加 `jsonschema>=4.26`
|
||||
|
||||
### 还是需要 Charles 决策
|
||||
|
||||
- 放量规模(推算:52MB/项目 × 12493 ≈ 650GB 全量,需评估 Gitea LFS 容量)
|
||||
- 是否需要抓 `u.lceda.cn` 的 EasyEDA 源 JSON(需登录,v0.1 跳过)
|
||||
|
||||
---
|
||||
|
||||
|
||||
Reference in New Issue
Block a user