라벨이 Sakana AI인 게시물 표시

오케스트레이션이 제품이 됐다 — Sakana Fugu가 말하는 것과 안 말하는 것

이미지
Sakana Fugu는 그 오케스트레이션 자체를 모델로 만들어 파는 제품이다. 오늘(2026-06-22) 정식 출시됐다. 써보진 않았다. 그래서 후기는 아니다. 공개된 자료로 주장과 빈칸만 따졌다. 한 줄로 정리하면 이렇다. Fugu에는 진짜 새로운 한 가지와, 아직 아무도 독립 검증하지 않은 여러 빈칸이 같이 들어 있다. 누가 읽으면 좋은가 멀티에이전트·오케스트레이션을 직접 엮어본 사람 “모델이 모델을 부린다”가 마케팅인지 진짜 새 구조인지 궁금한 사람 LangGraph나 OpenRouter를 쓰면서 그다음이 뭔지 보는 사람 Fugu가 진짜 새로운 한 가지 Fugu는 라우팅 규칙을 손으로 짠 게 아니라, 오케스트레이션을 학습한 모델 이다. 작업을 받으면 직접 풀거나, 전문 모델들을 불러 팀을 꾸리고, 검증·합성까지 한다. 자기 자신을 재귀로 다시 부르며 “1차 답이 부족했다”를 인지하고 교정하기도 한다. 근거는 Sakana의 ICLR 2026 논문 두 편이다. TRINITY (arXiv 2512.04695)는 진화 전략으로 학습한 0.6B 지휘자가 Thinker·Worker·Verifier 역할을 나눠주고, The Conductor 는 7B 모델을 강화학습으로 훈련해 자연어 협응 전략을 스스로 찾게 한다. Fugu는 이 둘을 개선해 상품화한 것이다(제품 지휘자 크기는 비공개). 풀에는 Opus 4.8, Gemini 3.1 Pro, GPT-5.5가 들어간다. 그리고 이 풀을 지휘해 풀 멤버 각각보다 더 잘한다 고 주장한다. 라우터(한 개 고르기)도 프레임워크(손으로 배선)도 아닌, “훈련된 오케스트레이터 = 모델”이라는 자리는 카테고리상 분명히 새롭다. 그런데 — 빈칸들 여기서부터가 불편한 부분이다. 벤치마크는 전부 Sakana 자체 보고고 독립 검증이 아직 없다. Fugu Ultra가 SWE-Bench Pro 73.7로 Opus 4.8(69.2)을 앞선다지만, 정작 풀에 없는 Fable 5가 그 벤치와 Humanity’s Las...