Allow login content; plan cloud infra, storage tiers, EDA→KiCad conversion
Why: - 策略调整:登录后才能访问的内容从"禁止"改为"纳入本项目范围", 同时明确凭据管理红线(合法账号、不入 git、云服务器隔离)。 解锁 u.lceda.cn 工程源 JSON,这是训练数据质量的关键升级。 - 计划中"存储"和"运行环境"一直模糊,现在按 Charles 提供的广州云服务器 + 存储分级演进(Gitea LFS → 对象存储)给出清晰路径。 - 打通 oshwhub (EasyEDA) 与 bshada/open-schematics (KiCad) 两个生态, 需要一个 EDA→KiCad 批转换脚本。先把它纳入 plan,等拿到工程源再实现。 What: - CLAUDE.md: 登录态条款从"不抓"改为"合法账号可抓",凭据管理写死在 ~/.secrets/,事件记 docs/secrets.md;合规红线同步更新 - plan.md §0.5: 新增 基础设施段(机器初始化 / 调度 / 登录态获取) - plan.md §1.4: 存储分级演进(< 50 GB 云盘,50-200 GB 评估,> 200 GB 迁对象存储) - plan.md §1.6: 登录态抓 u.lceda.cn 工程源 - plan.md §1.7: scripts/convert_to_kicad.py 批处理,候选 easyeda2kicad.py - plan.md 风险表: 加账号封禁 / 转换失败 / 云服务器单点故障三条 - docs/sources/oshwhub.md: u.lceda.cn 从"未开放"移到"需登录,已纳入范围" - README.md 数据源表: 加"登录态"列 + 运行环境说明 - log.md: 本次策略变更记录 未改:未新增 docs/infra.md(等机器到位 + 真实细节后再写),scripts/convert_to_kicad.py 尚未实现(等拿到工程源样本再实现)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
50
log.md
50
log.md
@@ -4,6 +4,56 @@
|
||||
|
||||
---
|
||||
|
||||
## 2026-04-23 20:10 策略大调:登录内容入场 + 云服务器 + EDA→KiCad 转换
|
||||
|
||||
**Claude 会话**
|
||||
|
||||
四项变更落实到文档(暂不写代码,等云服务器到位):
|
||||
|
||||
### 1. 登录态内容纳入范围
|
||||
|
||||
原则(`CLAUDE.md`):
|
||||
- 合法账号登录后抓,**禁止**盗号 / 共享号
|
||||
- 凭据集中云服务器 `~/.secrets/` (mode 700),**不入** git / 日志 / metadata
|
||||
- 仍不绕付费墙、不破 DRM、不抓站点明确禁抓的内容
|
||||
- 换号 / 重登事件记 `docs/secrets.md`(只事件、不含值)
|
||||
|
||||
### 2. 云服务器(广州,待交付)
|
||||
|
||||
新增 plan.md §0.5 基础设施段:
|
||||
- 0.5.1 机器初始化:git / git-lfs / uv / python 3.11+,非 root SSH,`~/.secrets/`
|
||||
- 0.5.2 调度:tmux/nohup 长跑 + systemd timer 增量
|
||||
- 0.5.3 登录态获取:cookie 导出流程
|
||||
|
||||
### 3. 存储分级演进
|
||||
|
||||
plan.md §1.4 改写:
|
||||
- 前期 < 50 GB:云服务器磁盘 + Gitea LFS
|
||||
- 中期 50–200 GB:评估 Gitea 容量压力;扩容 or 分仓
|
||||
- 后期 > 200 GB:迁对象存储(OSS / COS / MinIO),Gitea 只存元数据 + 指针
|
||||
- 50 GB 是决策评估点,**不**过早迁移
|
||||
|
||||
### 4. 立创 EDA → KiCad 转换
|
||||
|
||||
新增 plan.md §1.6(登录态工程源抓取)+ §1.7(EDA→KiCad 转换):
|
||||
- §1.6 用登录账号抓 `u.lceda.cn/api/project/<uuid>` 工程源 JSON,存 `source.json`
|
||||
- §1.7 写 `scripts/convert_to_kicad.py`,候选工具 `easyeda2kicad.py`(pypi,活跃维护)
|
||||
- 批处理扫 `data/raw/oshwhub/` → 输出 `data/processed/oshwhub/<uuid>/kicad/`
|
||||
- 跑 `kicad-cli sch erc / pcb drc` 做语法校验,失败样本记 `data/state/convert_failed.jsonl`
|
||||
- 目的:打通 oshwhub (EasyEDA) 与 bshada/open-schematics (KiCad) 两个生态的训练语料
|
||||
|
||||
### 同步改动
|
||||
|
||||
- `docs/sources/oshwhub.md` §3.5 从"未开放"改为"需登录,纳入范围";R4 风险更新
|
||||
- `README.md` 数据源表加「登录态」列,加运行环境说明
|
||||
|
||||
### 等待
|
||||
|
||||
- 广州云服务器到位 → 启动 Phase 0.5
|
||||
- 账号登录凭据由 Charles 提供
|
||||
|
||||
---
|
||||
|
||||
## 2026-04-23 19:55 oshwhub.md 重写成完整调研文档
|
||||
|
||||
**Claude 会话**
|
||||
|
||||
Reference in New Issue
Block a user