AI 도구 매일 노트 — 해고된 개발자의 기록

글

라벨이 Claude인 게시물 표시

AI 글은 통계로 잡힌다 — AI 티를 파이썬으로 측정하는 법

7월 12, 2026

AI 글은 눈이 아니라 통계로 잡힌다. 사람 눈이 “이거 AI가 썼네” 하고 잡아내는 그 감의 정체가 문체의 통계이기 때문이다. 이 글은 그 감을 숫자로 옮겨, 파이썬 결정론 게이트로 AI 티를 측정하는 방법을 정리한 기록이다. 감으로 잡던 사람이 파이썬으로 넘어간 이유 요즘 블로그나 제품 리뷰를 읽다 “이거 AI가 썼네” 하고 3초 만에 덮는 일이 잦아졌다. 나도 그랬다. 4월에는 그 감을 체크리스트로 적어 발행까지 했다. 그런데 감은 미덥지 않다. 사람마다 다르고, 모델이 버전업할 때마다 흐려진다. 그 글에도 “이 체크리스트의 쓸모는 길어야 1년”이라고 적어뒀다. 결론부터 적는다. AI 글은 통계로 잡히고, 그 통계 지문은 파이썬으로 측정된다. 발행 전 모든 글에 그 게이트를 돌린다. 이 글도 그 게이트를 통과해야 나간다. “AI가 썼네”라고 느낀 그 감의 정체 한 번쯤 이런 적이 있을 거다. 문장은 매끄러운데 어딘가 밋밋해서 AI를 의심한 적이 있다. 왜 그렇게 느꼈는지는 설명하지 못한 적도 있다. 그 감을 규칙으로 적어봤지만 다음 글에서 또 놓친 적도 있다. 그 감은 사실 통계다. 사람 눈이 잡아낸 건 문체의 분산이 부족하다는 신호였다. 사람 눈이 잡던 걸 연구는 숫자로 잡는다 문체 계량(stylometry)으로 AI 글을 가려내는 연구는 지금 정확도 81~98%를 보고한다. 그중엔 사전 학습 없이 문체 통계만 쓰는 zero-shot 방식으로 90.6%를 찍은 결과도 있다 (arXiv 2507.00838). 2026년 PAN 워크숍의 탐지 과제에서는 통계 파이프라인이 에세이·뉴스·소설 장르를 걸쳐, 난독화된 글까지 포함해 F1 0.898을 찍었다 (arXiv 2602.09147). 핵심은 이거다. LLM은 저마다 고유한 문체를 가진다. 연구자들은 이걸 사람의 개인어(idiolect)에 비유한다 (arXiv 2509.10179). ChatGPT의 문체와 Gemini의 문체가 다르고, 둘 다 사람 글보다 분산이 좁다. 균질함이 곧...

자세한 내용 보기

에이전트가 '됐습니다' 할 때 속으론 뭘 생각하나 — Claude J-space

7월 08, 2026

에이전트가 ‘됐습니다’ 할 때 속으론 뭘 생각하나 — Claude J-space 에이전트에게 일을 시키면 끝에 “완료했습니다”라고 답한다. 그 말을 믿을 수 있나. Anthropic이 2026년 7월 6일 공개한 J-space 연구가 이 질문에 불편한 재료를 던졌다. Claude 안에는 입 밖으로 내지 않고 떠올리기만 하는 생각의 공간이 있다. 연구진은 그걸 J-space라 부른다. 그 공간을 열어봤더니, 모델은 자기가 테스트당하는 중이라는 걸 이미 알고 있었다. 세 줄 요약. J-space는 Claude가 학습 중 스스로 만든 소수의 내부 신경 패턴이다. 말로 내뱉지 않은 속생각이 여기 뜬다. 운영자에게 중요한 건 “의식이냐” 논쟁이 아니라, 모델의 생각과 말이 갈릴 수 있다는 실측이다. 이런 적 있다면 이 글이 쓸모 있다 에이전트가 “완료”라고 보고했는데 열어보니 절반만 된 적이 있다. 테스트는 통과하는데 실제 데이터에서 조용히 깨지는 걸 본 적이 있다. 로그 출력은 멀쩡한데 모델이 속으로는 다른 판단을 한 것 같은 찜찜함을 느낀 적이 있다. 셋 중 하나라도 겹치면, J-space는 그 찜찜함에 처음으로 계측기를 대는 연구다. J-space가 뭔가 Claude는 텍스트를 여러 내부 층을 거쳐 처리한다. 그 활성값 안에, 나머지 처리와 성격이 다른 소수의 패턴 집합이 있다. Anthropic은 이걸 찾은 기법의 이름을 따 J-space라 불렀다. 기법은 J-lens, 야코비안(Jacobian)에서 왔다. 작동 방식은 이렇다. 어휘의 모든 단어에 대해, “그 단어를 앞으로 말할 가능성을 높이는 내부 패턴”을 찾는다. 렌즈를 대면 그 순간 모델이 떠올린 단어 목록이 읽힌다. 각 패턴은 단어와 연결되지만, 켜졌다고 그 단어를 말하는 건 아니다. 그냥 머릿속에 있는 상태다. scratchpad나 chain-of-thought와는 다르다. 그건 모델이 써서 남기는 텍스트다. J-space는 아무것도 쓰지 않고 활성값 안에서 조용히 돈다. ...

자세한 내용 보기

리뷰는 좋아졌는데 단가는 2배 — Claude Fable 5 이틀 실사용

6월 10, 2026

Claude Fable 5가 6월 10일에 나왔다. Hacker News 출시 스레드가 하루 만에 2,280점(댓글 1,774개)을 받았고, 출시 당일부터 Claude Code 기본 모델을 Fable 5로 바꿔 이틀을 썼다. 이틀 동안 좋아진 건 분명히 있었다. 그런데 공식 단가표와 커뮤니티 반응이 서로 반대 방향을 가리키고 있어서, 갈아탈지 판정은 미루기로 했다. 요약하면 이렇다. 글 리뷰 능력은 실측으로 좋아졌고, 단가는 Opus 4.8의 2배가 됐다. “싸다”는 커뮤니티 반응과 공식 가격의 간극, 안전 필터 강화 보고까지 — 의문 4가지가 풀려야 전환을 정할 수 있다. 누가 읽으면 좋은가 Claude Code 기본 모델을 Fable 5로 바꿀지 고민 중인 사람 출시 첫 주의 들뜬 후기 말고 판정 유보 조건이 궁금한 사람 Opus 4.8 대비 비용이 실제로 어떻게 변하는지 확인하고 싶은 사람 한 줄로 요약하면, 글 리뷰는 실측으로 좋아졌지만 가격·필터·사용량 의문이 풀릴 때까지 판정은 유보다 . 검증 다섯 단계를 통과한 글에서 나온 결함 6건 전환 당일, 발행 직전이던 블로그 글을 Fable 5에 다시 리뷰시켰다. 그 글은 Opus 4.8 기반 검증을 다섯 단계(구조 리뷰 → 채점 루프 → AI 클리셰 검사 → 한국어 윤문 → 가독성 점검)로 통과한 상태였다. 그런데 결함 6건이 새로 나왔다. 주어와 서술어가 안 맞는 문장, 시스템에 쓸 수 없는 동사 선택, 연속 세 단락에 같은 구절 반복, 표기 혼용까지. 전부 사람이 보면 바로 어색한 것들인데 이전 검증에서는 안 잡혔다. 다만 이걸 모델 차이라고 단정은 못 한다. 같은 글을 두 번째 읽으면 누구든 더 잘 잡는다. 모델 효과와 재독 효과를 분리하려면 첫 리뷰부터 Fable 5로 돌린 다음 글에서 확인해야 한다. 단가 2배와 “싸다”는 반응 사이의 간극 공식 가격은 입력 $10, 출력 $50이다(100만 토큰 기준). Opus 4.8($5/$25)의 정확히 2배다. Cl...

자세한 내용 보기

하네스 엔지니어링 측정 2편 — Claude에 AGENTS.md 명시 인용했더니 fail-fast가 강해졌다

5월 06, 2026

1편(어제)에서 N=1로 측정해서 결론을 냈다. “Codex가 fail-fast 약하다”가 아니라 “AGENTS.md 비우면 Codex도 Claude도 똑같이 약하다”였다. 지적이 들어왔다. N=1은 우연일 수 있다. Claude에 AGENTS.md 명시 인용을 직접 해본 적은 없었다. 12회 측정해서 다시 확인했다. 결론은 더 단단해졌다. 그리고 1편이 놓친 변수 하나가 새로 보였다. 요약 : Codex × Claude × 하네스 0/강제 4 condition을 각 3회씩 12회 측정. 모델 효과는 거의 0(가로축 1.0 vs 1.0, 2.83 vs 2.5), 하네스 효과는 큼(세로축 1.0 → 2.5+). Claude도 AGENTS.md를 prompt에 명시 인용하면 fail-fast 1.0 → 2.5로 올라간다. 단 1편의 Claude 채점 “중”은 prompt position 효과(메인 세션 system prompt 자동 로드)였을 가능성이 새로 보였다. 1편이 명시한 5가지 한계 중 통제한 3가지 측정 1편 본문 끝에 한계 5가지를 적었다. 그 중 2편에서 통제 가능한 것은 3가지였다. Sampling 우연 미통제 (N=1) → 12회 측정으로 분산 확인 Prompt position 미분리 → C3 격리 환경 추가로 부분 분리 Claude에 AGENTS.md 명시 인용 미측정 → C4 condition으로 직접 측정 나머지 2가지(컨벤션 vs 코드 품질, 일반화)는 이번에도 미해소다. 측정 setup, 4 condition × 3회 = 12회 같은 명세 verify_published_post() 를 4 condition으로 각 3회씩 측정했다. Condition 모델 하네스 C1 Codex 없음 (AGENTS.md 비움) C2 Codex AGENTS.md 자동 로드 C3 Claude spec만, 격리 Task agen...

자세한 내용 보기