라벨이 Claude Code인 게시물 표시

글쓰기 프롬프트는 일회성인가 자산인가 — vibe-writing 11개 스킬을 SKILL.md 라이브러리로 묶은 이유

이미지
좋아서 한 번 쓴 SKILL.md, 다시 찾으려면 어디 있나? 이 질문에 답하려고 만든 게 vibe-writing 이다. 글쓰기 라이프사이클 — 초안·리뷰·다듬기·발행 — 을 위한 11개 스킬을 SKILL.md 포맷으로 묶어 OSS로 공개한 라이브러리다(저장소: github.com/jason-h23/vibe-writing ). 한 줄 결론 : 글쓰기 프롬프트는 휘발되지만 SKILL.md로 묶으면 자산이 된다. 단, 자산화에는 비용이 따른다. 이 글은 이미 프롬프트·스킬 10개 이상 누적해서 흩어진 자산을 정리해야 하는 사람 을 위한 것이다 — 처음 시작하는 사람에겐 별 의미 없다. 자산화의 두 갈래 — SDK vs SKILL 라이브러리 프롬프트를 자산으로 만들려면 두 갈래가 있다. (1) Anthropic SDK·OpenAI SDK 같은 코드 자산, (2) Claude Code의 SKILL.md 같은 마크다운 자산. 저자는 에이전트 스킬 vs SDK 글 에서 후자를 택한 이유를 정리한 적이 있다. 1인 운영자에게 SDK는 과한 인프라이고, SKILL은 즉시 합치고 분리할 수 있는 단위다. 결정적 신호 하나는 monarchjuno/vibe-investing 이었다. 13명 투자가 페르소나를 SKILL.md로 묶은 OSS가 12일 만에 77⭐를 받았다(출처: GitHub API, 2026-04-27 조회). 단, 이 ⭐가 실사용 입증인지 호기심 클릭인지는 아직 모른다 — 단일 사례로 보편 명제를 도출하기엔 이르다는 점은 인정한다. vibe-writing — 3 카테고리 11 스킬 카테고리 수 스킬 content-review 5 devil, simon-review, refine-to-9, ai-cliche-check, writing-review-pipeline content-production 4 blog-draft, blog-thumbnail, blog-topic-dedup, humanize-korean meta ...

내 워크로드 5개로 LLM 벤치 직접 돌리는 법 — Qwen 3.6 vs Sonnet 4.6 한국어 실측 방법과 첫 결과

이미지
트렌드 리포트에서 “Qwen 3.6-27B가 Sonnet 4.6 동급”이라는 수치 보고 모델 바꿀 뻔한 적 있으시죠? Artificial Analysis 같은 대규모 벤치 결과가 내 실제 워크로드에 맞는지 의심해본 적 있으시죠? 그런데 직접 돌려보긴 귀찮아서 남의 벤치만 믿고 살아온 적 있으시죠? 남의 벤치 대신 내 5 태스크를 한 번 돌려봤다. M4 Max 128GB에서 Qwen 3.6-27B Dense, Qwen 3.6-35B-A3B MoE, Claude Sonnet 4.6 세 모델을 한국어 개발 워크로드 5개로 비교했다. 샘플 5건 × 1회라 통계적 일반화는 못 하지만, 한 번 돌리니 남의 벤치로는 안 보이던 것들이 보였다. 이 글은 재현 가능한 방법론 과 첫 실행 결과, 그리고 한국어 블로거에게 실제로 문제가 될 실패 모드 두 가지 를 정리한 기록이다. 먼저 요약 — 도입부만 읽으실 분을 위해 방법은 재사용 가능 : 본인 워크로드 5 태스크 + 3 모델 × 1회 실행. 한 시간 투자로 다음 모델 릴리스마다 반복 가능. 한국어 프로덕션 리스크 2건 발견 : Qwen 35B-A3B에서 한자 “历史信息”가 한국어 문장에 혼입, 27B는 SEO 태스크에서 thinking 토큰 cap을 소진하고 최종 답 생성 실패. 수치는 참고만 : 1회 실행이라 편차(variance) 있음. “Sonnet이 전체 품질 1위”는 인상평 수준. 단 두 Qwen 간 격차(35B-A3B가 27B Dense보다 2.8배 빠름)는 재현성 높은 현상. 자기 평가 편향 주의 : 품질 점수는 Claude(Opus 4.7)가 Sonnet 포함해 주관 채점한 것이라 같은 Claude 가족 편향 가능성이 있다. 아래 “예상 질문” 섹션에서 검증 방법을 다룬다. 5 태스크 워크로드 설계법 — 한 시간이면 세팅 끝 재현할 수 있는 틀을 먼저 공유한다. 본인 워크로드에서 5개만 골라 ollama run 또는 claude -p 로 돌리면 된다. Task 1 — 버그픽스 : 의...