2026년 4월 8일, 메타가 Muse Spark를 공개했습니다. Meta Superintelligence Labs가 개발한 첫 번째 모델이자, 실망스러웠던 Llama 4 이후 메타의 AI 재건을 알리는 신호탄입니다. 무엇을 할 수 있는지, GPT-5.4·Claude·Gemini와 어떻게 비교되는지, 그리고 WhatsApp과 인스타그램을 매일 쓰는 30억 명에게 무엇이 달라지는지 정리했습니다.
Muse Spark는 메타의 새로운 "Muse" 시리즈의 첫 번째 모델입니다. Scale AI CEO 출신 Alexandr Wang이 이끄는 Meta Superintelligence Labs가 개발했습니다. Wang은 약 140억 달러(약 19조 원) 규모의 계약으로 9개월 전 메타에 합류했습니다.
가장 큰 변화는 전략 전환입니다. 메타는 그동안 누구나 내려받아 수정할 수 있는 오픈소스 Llama 모델로 개발자 생태계를 쌓아왔습니다. 그러나 Muse Spark는 클로즈드 모델입니다 — 구조와 가중치가 공개되지 않습니다. 메타는 "미래 버전은 오픈소스로 출시할 계획"이라고 밝혔습니다.
💡 왜 이름이 바뀌었을까? 프로젝트의 내부 코드명은 "아보카도(Avocado)"였습니다. 메타는 새 시리즈 전체를 "Muse", 첫 번째 모델을 "Muse Spark"로 브랜딩했습니다 — 저조했던 Llama 4 브랜드와 선을 긋고 새 출발을 알리는 의미입니다.
작업에 따라 두 가지 모드를 전환할 수 있습니다. Instant 모드는 일상적인 질문에 빠르게 답합니다. Thinking 모드는 복잡한 문제를 깊이 추론합니다 — GPT-5.4의 확장 사고 기능과 유사한 방식입니다.
복잡한 쿼리를 처리할 때 여러 서브에이전트를 병렬로 실행합니다. 메타의 예시: 플로리다 가족 여행 계획을 요청하면, 한 에이전트는 일정을 짜고, 다른 에이전트는 도시를 비교하고, 세 번째 에이전트는 어린이 친화 활동을 찾습니다 — 동시에.
사진을 찍으면 메타 AI가 실시간으로 분석합니다. 공항 간식 매대를 촬영하면 단백질이 가장 많은 간식을 순위별로 알려줍니다. 메타의 AI 글라스에서는 이 기능이 특히 강력해집니다 — 착용자가 보는 것을 지속적으로 처리할 수 있기 때문입니다.
인스타그램·페이스북의 크리에이터 콘텐츠, 브랜드 포스팅, 커뮤니티 트렌드를 기반으로 옷 구매나 인테리어 데코를 도와주는 커머스 기능입니다. 팔로우하는 계정의 스타일에서 영감을 받아 제품을 추천합니다.
지금 당장은 Meta AI 앱과 meta.ai에서만 사용 가능합니다. 수 주 내로 WhatsApp, 인스타그램, 페이스북, 메신저, AI 글라스에 순차 배포됩니다 — 기존 Llama 기반 챗봇을 대체합니다.
Artificial Analysis Intelligence Index v4.0 기준 출시 당시 점수 비교입니다:
| 모델 | 인텔리전스 지수 | 강점 | 약점 |
|---|---|---|---|
| GPT-5.4 | 57 1위 | 범용성, 코딩, 추론 | API 비용 |
| Gemini 3.1 Pro | 57 1위 | 추론, 가성비, Google 통합 | 컨텍스트 일관성 |
| Claude Opus 4.6 | 53 | 글쓰기, 장문 분석, 정확성 | 단순 작업 속도 |
| Muse Spark | 52 | 멀티모달, 의료 추론, 소셜 맥락 | 추상 추론, 코딩 |
솔직한 평가: Muse Spark는 경쟁력이 있지만 아직 선두가 아닙니다. 도표 이해(CharXiv Reasoning 86.4%)와 의료 추론(HealthBench Hard 42.8%)에서 강점을 보이지만, 추상 추론(ARC-AGI-2 42.5%)과 코딩에서는 GPT-5.4, Claude에 뒤처집니다.
하지만 벤치마크가 전부가 아닙니다. Muse Spark의 진짜 경쟁력은 성능이 아니라 배포 규모입니다. 어떤 AI 모델도 WhatsApp·인스타그램·페이스북처럼 30억 명이 매일 쓰는 앱에 내장되어 있지 않습니다. Muse Spark가 WhatsApp에 배포되면, 벤치마크 점수와 관계없이 세계에서 가장 많이 쓰이는 AI 중 하나가 됩니다.
2025년 초 출시된 Llama 4는 GPT-4o나 Claude 3.5에 미치지 못한다는 평가를 받았고, 개발자들의 기대를 충족시키지 못했습니다. 이 실패가 Zuckerberg로 하여금 Alexandr Wang을 영입하고 AI 조직 전체를 재건하는 계기가 됐습니다.
메타에 따르면 팀은 지난 9개월간 "AI 스택을 처음부터 다시 구축"했습니다 — 새로운 훈련 기법, 새로운 인프라, 각 세대가 다음 세대의 토대를 검증하는 새로운 스케일링 접근법. Muse Spark는 의도적으로 "작고 빠르게" 설계된 기반 모델이며, 더 큰 차세대 모델이 이미 개발 중입니다.
가장 논란이 많은 부분입니다. 메타는 Llama 오픈소스 모델로 개발자 생태계 내에서 신뢰를 쌓아왔습니다. Muse Spark는 그 전통을 깼습니다.
메타는 "미래 버전의 오픈소스 출시를 희망한다"고 밝혔고, Wang은 Muse 시리즈 일부는 독점 유지, 일부는 공개할 수 있다고 언급했습니다. 개발자들에게는 의미 있는 변화입니다. Llama 생태계가 사라지는 건 아니지만, 후속 모델이 오픈소스라는 보장은 이제 없습니다.
WhatsApp 사용자: 가장 즉각적인 영향을 받습니다. WhatsApp을 주요 소통 수단으로 쓰는 수억 명이 이미 쓰는 앱 안에서 훨씬 스마트한 AI 어시스턴트를 구독료 없이 이용하게 됩니다.
메타 플랫폼 기반 비즈니스: 쇼핑 모드와 크리에이터 연계 추천 기능은 새로운 광고·커머스 접점을 만듭니다. 인스타그램이나 페이스북에서 제품을 판매 중이라면 AI 기반 발견 기능이 전략적으로 중요해집니다.
엔터프라이즈 개발자: 현재 파트너 프라이빗 프리뷰 API만 제공됩니다. API가 열리면 멀티모달·멀티에이전트 기능이 소셜 커머스와 고객 서비스 애플리케이션에 유용할 수 있습니다.
건강·의료 관심자: Muse Spark는 의료 추론 벤치마크에서 좋은 점수를 받았습니다. 건강 관련 정보 탐색에 유용할 수 있지만, 전문 의료 조언을 대체할 수 없다는 점은 분명합니다.
Muse Spark는 메타 AI의 진정한 컴백입니다. 업계 1위는 아니지만 더 이상 뒤처지지 않습니다. 순수 인텔리전스 벤치마크에서는 GPT-5.4, Gemini 3.1 Pro, Claude Opus 4.6에 소폭 뒤처지지만, 멀티모달 인식과 의료 추론에서 고유한 강점을 보입니다. 진짜 강점은 배포 규모입니다: 구독료 없이, 30억 명이 이미 쓰는 앱에 내장됩니다. 대부분의 사람들에게 최고의 AI는 가장 똑똑한 AI가 아니라 이미 주머니 속에 있는 AI입니다. Muse Spark는 곧 엄청나게 많은 주머니 속에 들어갈 것입니다.
메타가 AI 경쟁에 복귀했습니다. Muse Spark는 아직 1위가 아니지만, 경쟁력 있고 광범위하게 배포될 모델이며 더 큰 로드맵의 토대입니다. WhatsApp 배포 시점에 실제 영향력이 드러날 것입니다.
저희는 Meta AI(Muse Spark)를 도구 디렉토리에 추가했습니다. 비교 페이지에서 다른 AI 어시스턴트와 직접 비교해보세요.