Allow login content; plan cloud infra, storage tiers, EDA→KiCad conversion

Why:
- 策略调整:登录后才能访问的内容从"禁止"改为"纳入本项目范围",
  同时明确凭据管理红线(合法账号、不入 git、云服务器隔离)。
  解锁 u.lceda.cn 工程源 JSON,这是训练数据质量的关键升级。
- 计划中"存储"和"运行环境"一直模糊,现在按 Charles 提供的广州云服务器
  + 存储分级演进(Gitea LFS → 对象存储)给出清晰路径。
- 打通 oshwhub (EasyEDA) 与 bshada/open-schematics (KiCad) 两个生态,
  需要一个 EDA→KiCad 批转换脚本。先把它纳入 plan,等拿到工程源再实现。

What:
- CLAUDE.md: 登录态条款从"不抓"改为"合法账号可抓",凭据管理写死在
  ~/.secrets/,事件记 docs/secrets.md;合规红线同步更新
- plan.md §0.5: 新增 基础设施段(机器初始化 / 调度 / 登录态获取)
- plan.md §1.4: 存储分级演进(< 50 GB 云盘,50-200 GB 评估,> 200 GB 迁对象存储)
- plan.md §1.6: 登录态抓 u.lceda.cn 工程源
- plan.md §1.7: scripts/convert_to_kicad.py 批处理,候选 easyeda2kicad.py
- plan.md 风险表: 加账号封禁 / 转换失败 / 云服务器单点故障三条
- docs/sources/oshwhub.md: u.lceda.cn 从"未开放"移到"需登录,已纳入范围"
- README.md 数据源表: 加"登录态"列 + 运行环境说明
- log.md: 本次策略变更记录

未改:未新增 docs/infra.md(等机器到位 + 真实细节后再写),scripts/convert_to_kicad.py
尚未实现(等拿到工程源样本再实现)。

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
Zhang Jiahao
2026-04-23 20:57:30 +08:00
parent ba501c328c
commit b0ddcf3f14
5 changed files with 158 additions and 29 deletions

50
log.md
View File

@@ -4,6 +4,56 @@
---
## 2026-04-23 20:10 策略大调:登录内容入场 + 云服务器 + EDA→KiCad 转换
**Claude 会话**
四项变更落实到文档(暂不写代码,等云服务器到位):
### 1. 登录态内容纳入范围
原则(`CLAUDE.md`
- 合法账号登录后抓,**禁止**盗号 / 共享号
- 凭据集中云服务器 `~/.secrets/` (mode 700)**不入** git / 日志 / metadata
- 仍不绕付费墙、不破 DRM、不抓站点明确禁抓的内容
- 换号 / 重登事件记 `docs/secrets.md`(只事件、不含值)
### 2. 云服务器(广州,待交付)
新增 plan.md §0.5 基础设施段:
- 0.5.1 机器初始化git / git-lfs / uv / python 3.11+,非 root SSH`~/.secrets/`
- 0.5.2 调度tmux/nohup 长跑 + systemd timer 增量
- 0.5.3 登录态获取cookie 导出流程
### 3. 存储分级演进
plan.md §1.4 改写:
- 前期 < 50 GB云服务器磁盘 + Gitea LFS
- 中期 50200 GB评估 Gitea 容量压力;扩容 or 分仓
- 后期 > 200 GB迁对象存储OSS / COS / MinIOGitea 只存元数据 + 指针
- 50 GB 是决策评估点,**不**过早迁移
### 4. 立创 EDA → KiCad 转换
新增 plan.md §1.6(登录态工程源抓取)+ §1.7EDA→KiCad 转换):
- §1.6 用登录账号抓 `u.lceda.cn/api/project/<uuid>` 工程源 JSON`source.json`
- §1.7 写 `scripts/convert_to_kicad.py`,候选工具 `easyeda2kicad.py`pypi活跃维护
- 批处理扫 `data/raw/oshwhub/` → 输出 `data/processed/oshwhub/<uuid>/kicad/`
-`kicad-cli sch erc / pcb drc` 做语法校验,失败样本记 `data/state/convert_failed.jsonl`
- 目的:打通 oshwhub (EasyEDA) 与 bshada/open-schematics (KiCad) 两个生态的训练语料
### 同步改动
- `docs/sources/oshwhub.md` §3.5 从"未开放"改为"需登录,纳入范围"R4 风险更新
- `README.md` 数据源表加「登录态」列,加运行环境说明
### 等待
- 广州云服务器到位 → 启动 Phase 0.5
- 账号登录凭据由 Charles 提供
---
## 2026-04-23 19:55 oshwhub.md 重写成完整调研文档
**Claude 会话**