정보 유목민의 정착지🐾

AI

🎯 사람처럼 영상을 이해하는 AI? Twelve Labs가 보여준 미래!

똑다람쥐 2025. 5. 13. 10:35
728x90

“영상 속에서 내가 찾는 장면만 쏙쏙 찾아낼 수 없을까?”
혹시 여러분도 유튜브, 넷플릭스, CCTV 영상 보면서
이런 생각 해보신 적 있으신가요?

 

그 상상을 현실로 만드는 기업이 있습니다.
바로 요즘 전 세계에서 주목받고 있는 Twelve Labs예요.

 

📌 단순히 ‘영상 검색’이 아니라
📌 사람처럼 영상 전체 맥락을 파악하는 AI 기술을 가진 곳!
그럼 지금부터 이 놀라운 기업과 기술,
쏙쏙 정리해 드릴게요.


🔍 Twelve Labs, 어떤 회사인가요?

Twelve Labs는 2021년 미국 샌프란시스코에서 설립된 스타트업입니다.
지금은 한국 서울 용산에도 지사를 두고 있어요.

이 회사는 영상 이해 AI 기술을 전문적으로 개발하고 있는데요.


단순히 장면을 ‘찍고 분류’하는 걸 넘어서,
🎯 영상 속 맥락, 사운드, 자막, 움직임까지 통합해서 이해하는 게 포인트입니다.

그 기술력 덕분에
✔ NVIDIA
✔ NEA
✔ Index Ventures
등 글로벌 대형 투자사로부터 총 1억 700만 달러 이상 투자도 받았어요!


💡 핵심 기술 ① Marengo: 영상의 모든 요소를 통합!

Marengo는 Twelve Labs의 대표적인 AI 모델이에요.
이름부터 기억하세요. 마렌고!

이 기술은요...

✅ 프레임(화면)
✅ 오디오(배경음/음성)
✅ 텍스트(자막/음성 인식)
✅ 시간 흐름

이 모든 요소를 동시에 분석해서
📍 “영상 내에서 사용자가 원하는 장면을 정확히 찾아주는” 기술이에요.

🧠 예를 들어,
“여자 주인공이 웃으면서 파란 셔츠 입은 남자와 인사하는 장면”
→ 이걸 텍스트로 검색하면
→ 그 장면이 바로 뜨는 거죠!


📘 핵심 기술 ② Pegasus: 요약·설명 생성의 끝판왕

영상 콘텐츠 요약, 이제 사람이 할 필요 없어요.
Twelve Labs의 Pegasus는
영상을 이해하고 자동으로 요약이나 설명을 생성해줍니다.

✅ 넷플릭스 시리즈 요약
✅ 유튜브 영상 하이라이트
✅ 기업 내부 영상 분석

모두 자동화 가능!

그리고 놀라운 건,
🎯 단순한 ‘장면 요약’이 아니라
맥락과 감정까지 반영한 텍스트 생성이 된다는 점이에요.


📺 어디에 쓰이나요?

Twelve Labs의 기술은 다양한 산업에 활용됩니다.

1. 스포츠 🎽

NFL 같은 미국 스포츠 리그에서
하이라이트 영상 자동 추출에 활용 중!

2. 보안 & CCTV 👁‍🗨

“밤 10시 이후, 파란색 옷을 입은 사람이 출입한 장면만 찾아줘”
→ 단 몇 초 만에 검색 가능

3. 방송·콘텐츠 🎬

넷플릭스, 유튜브, 방송국 등에서
수천 시간 분량의 콘텐츠 자동 정리·분석!

4. 교육 🎓

온라인 강의 콘텐츠에서 핵심만 추출해
학생들에게 요약 제공


📊 왜 이 기술이 특별할까?

Twelve Labs는 단순히 'AI가 영상 인식'을 넘어서
멀티모달 AI (시각, 청각, 텍스트 통합)
시간의 흐름까지 고려한 장면 해석
자연어로 검색 가능

이 3가지 요소를 모두 갖춘 세계 최초 수준의 기술력을 가지고 있어요.

쉽게 말하면,
“영상 속 ‘의미’를 알아듣는 AI”입니다.


🧠 글로벌 반응은?

✅ TechCrunch, VentureBeat 등 글로벌 미디어가
“가장 빠르게 성장하는 영상 AI 스타트업”으로 주목 중!

✅ 한국어, 영어, 다국어 지원까지 가능해
글로벌 확장성도 이미 확보!

✅ OpenAI, Google, Meta AI 못지않은
“실전형 기술력”으로 평가받고 있어요.


✨ 향후 전망은?

Twelve Labs는
🎯 생성형 AI와 영상 검색의 결합
🎯 실시간 보안 모니터링 AI
🎯 대규모 기업 데이터 검색 시스템
등 다양한 영역으로 확장될 예정이에요.

특히나 영상 데이터가 폭발적으로 늘고 있는 지금,
이들의 기술은
모든 산업에서 필요해질 가능성 100%!


✅ 마무리 요약

구분내용
기업명 Twelve Labs
설립 2021년 (미국)
한국지사 서울 용산
주요 기술 Marengo, Pegasus
핵심 분야 영상 검색, 요약, 분석
활용처 스포츠, 보안, 방송, 교육 등
투자 유치 총 $107M 이상
 

여러분은 어떻게 보셨나요?

📢 영상 검색 기술, 직접 써보고 싶지 않으신가요?
Twelve Labs의 기술은 이미 다양한 플랫폼에 적용되고 있답니다.

🤔 앞으로 이 기술, 어디에 활용되면 좋을까요?

💬 댓글로 여러분의 의견을 나눠주세요!

반응형