AI.PixelMind
본문 바로가기

전체 글343

오픈AI, 이미지 생성 속도 50배 향상한 AI 모델 ‘sCM’ 개발…실시간 콘텐츠 제작 현실화? 최근 오픈AI가 기존 이미지 생성 속도를 50배 높인 새로운 AI 모델을 개발해 큰 주목을 받고 있습니다. 기존의 AI 이미지 생성 방식은 다소 느리고 많은 계산 단계가 필요했지만, 이번에 공개된 sCM(연속 시간 일관성 모델)은 이를 획기적으로 줄여 거의 실시간에 가까운 속도로 이미지를 생성할 수 있다고 합니다. 기존 모델과 sCM 모델의 차이점 기존의 이미지 생성 모델인 확산 모델(Diffusion Model)은 이미지를 만들기 위해 수백 단계의 계산 과정을 거쳐야 했습니다. 이는 사실적인 이미지나 복잡한 3D 모델을 제작하는 데 강력했지만, 시간이 오래 걸려 실시간 생성에는 부적합했죠. 예를 들어, 기존의 확산 모델로 이미지를 생성할 때 보통 5초 이상이 소요되었습니다. 반면, sCM 모델은 단 1.. 2024. 10. 26.
GPT-5 ‘오라이온’ 출시설? 오픈AI CEO의 반박과 사실 여부는? 최근 AI 업계에서 GPT-5의 차기 모델인 ’오라이온(Orion)’이 12월에 출시될 것이라는 소식이 전해지면서 큰 관심을 받고 있습니다. 특히, 오픈AI가 오라이온 모델을 새롭게 선보이며 성능을 한층 강화하고, 일부 기업에 선제적으로 제공할 가능성이 있다는 소식이 퍼지고 있는데요. 하지만 이 소식에 대해 오픈AI CEO인 샘 알트먼은 “가짜 뉴스”라고 강하게 반박했습니다. 오라이온(Orion)이란? 오라이온은 GPT-5라고도 불리며 차세대 AI 모델로 알려져 있습니다. 일부 소식통에 따르면 기존의 GPT-4보다 최대 100배 성능이 뛰어날 가능성이 있다는 이야기까지 나오고 있습니다. 이러한 기대 속에서 오픈AI는 새로운 AI 기술을 통해 기존의 GPT-4를 넘어서는 성능을 제공할 계획이라고 알려졌습니.. 2024. 10. 26.
오픈AI, 범용 AI 에이전트 개발 끝났다… 코딩부터 일상 작업까지 자동화 오픈AI가 사람 대신 컴퓨터를 사용해 다양한 작업을 자동으로 처리할 수 있는 ‘AI 에이전트’를 내부에서 이미 개발하고 테스트까지 마쳤다고 합니다. 특히 코딩 작업을 수행할 수 있는 코딩 에이전트가 현재 내부적으로 활용되고 있어 주목을 받고 있습니다. 이는 앤트로픽이 최근 공개한 AI 에이전트와 유사하지만, 프로그래밍 기능이 더 강화된 것이 특징입니다. 이번 AI 에이전트의 개발 소식은 오픈AI가 기존의 ChatGPT보다 더욱 진보된 기술을 선보이려는 노력의 일환으로 볼 수 있습니다. 오픈AI의 CEO인 샘 알트먼은 한 인터뷰에서 "에이전트에 비하면 챗GPT는 훨씬 단순한 수준"이라고 언급한 바 있습니다.AI 에이전트의 실제 시연 내용오픈AI는 최근 AI 에이전트를 내부에서 시연하면서, 에이전트가 인터넷.. 2024. 10. 24.
스태빌리티 AI, ‘스테이블 디퓨전 3.5’ 오픈 소스로 출시 스태빌리티 AI가 이미지 생성 AI 모델의 새로운 버전인 '스테이블 디퓨전 3.5'를 오픈 소스로 공개했습니다. 이번 모델은 기존의 '스테이블 디퓨전 3 미디움'에서 개선된 기능을 갖추고 있으며, 다양한 버전으로 제공되어 사용자들이 필요에 따라 선택할 수 있습니다. 스테이블 디퓨전 온라인 바로가기 버튼을 눌러 지금 확인하세요!!스테이블 디퓨전 3.5의 주요 특징스테이블 디퓨전 3.5는 세 가지 주요 버전으로 나누어져 있으며, 각각의 버전은 다음과 같은 특징을 가지고 있습니다:스테이블 디퓨전 3.5 라지 (Large):80억 개의 매개변수로 구성된 고성능 모델입니다.프롬프트 정확도와 고품질 이미지 생성에 중점을 두고 설계되어, 마케팅 캠페인이나 기업의 디지털 자산 제작에 적합합니다.100만 화소 해상도를 .. 2024. 10. 24.
MS, 차등 트랜스포머로 성능 개선하며 LLM 새로운 아키텍처 공개 최근 마이크로소프트(MS)와 칭화대학교 연구진이 새로운 AI 기술, '차등 트랜스포머(Diff Transformer)'를 개발했다고 합니다. 이 기술은 AI가 긴 글을 읽을 때, 정말 중요한 부분에만 집중할 수 있도록 만들어줍니다. 이번 글에서는 차등 트랜스포머가 기존 기술보다 왜 더 좋은지, 어떻게 작동하는지, 그리고 우리 일상에 어떤 변화를 가져올 수 있는지 쉽게 설명해 보겠습니다.차등 트랜스포머란 무엇일까?우리가 일반적으로 사용하는 AI 기술, 예를 들어 ChatGPT 같은 모델은 '트랜스포머 아키텍처'라는 구조로 만들어져 있어요. 이 구조는 문장 속의 단어들을 이해할 때, 각 단어가 문장 전체에서 얼마나 중요한지 판단하는 '어텐션 메커니즘'을 사용합니다. 그런데 문제는 AI가 글을 읽을 때, 긴 .. 2024. 10. 24.
앤트로픽, AI 에이전트로 오픈AI에 선제공격: 컴퓨터 유즈와 클로드 3.5 소네트의 새로운 가능성 최근 AI 기술 경쟁이 뜨겁게 달아오르고 있습니다. 그중에서도 앤트로픽(Anthropic)이 선보인 새로운 AI 에이전트 기능은 특히 주목할 만합니다. 오픈AI와의 치열한 경쟁 속에서 앤트로픽은 컴퓨터 유즈(Computer Use) 기능과 업그레이드된 클로드 3.5 소네트 모델을 공개하며 다시 한번 경쟁의 우위를 선점하려는 의지를 보였습니다. 이번 글에서는 앤트로픽의 AI 에이전트 기능과 그 영향력에 대해 알아보겠습니다. 1. 앤트로픽의 '컴퓨터 유즈': 컴퓨터를 사람처럼 사용하는 AI앤트로픽이 새롭게 공개한 컴퓨터 유즈 기능은 사람처럼 자율적으로 컴퓨터를 사용하는 AI 에이전트입니다. 이를 통해 AI는 마치 사람이 하는 것처럼 화면의 UI를 인식하여 버튼을 클릭하고, 텍스트를 입력하며, 웹사이트를 탐색.. 2024. 10. 23.
AGI의 핵심 기술로 떠오르는 LWM '월드 모델'이란? 지난해 대형언어모델(LLM)이 인공지능(AI) 분야의 주요 트렌드였다면, 현재 AI 기술의 핵심으로 자리 잡고 있는 것은 '대형세계모델(LWM)'입니다. LWM은 텍스트뿐만 아니라 현실 세계의 다양한 데이터를 학습해, 인간과 유사한 인지 능력을 갖춘 '몸을 가진 AI(Embodied AI)'를 목표로 하는 기술입니다. AI의 한계를 뛰어넘어 인공일반지능(AGI)에 도달할 유력한 방법으로 주목받고 있으며, 로봇 공학, 자율주행 등 다양한 분야로의 확장 가능성을 지니고 있습니다. https://www.youtube.com/watch?v=XdYcendw3Pg LWM의 개념과 등장 배경LWM의 개념은 2018년 구글 재직 당시 사카나AI 공동 창립자인 데이비드 하가 발표한 논문에서 시작되었습니다. '세계 모델(.. 2024. 10. 23.
Perplexity: 퍼블렉시티 AI와 실시간 웹 검색의 혁신적인 결합 Perplexity는 최근 주목받는 인공지능(AI) 기반 검색 플랫폼으로, 실시간 웹 검색 기능을 통해 사용자의 질문에 깊이 있는 답변을 제공합니다. 단순한 정보 검색을 넘어서, Perplexity는 사용자에게 최신 정보를 신속하고 신뢰성 있게 전달하며, 다양한 모드를 통해 맞춤형 검색 경험을 제공합니다. 이번 글에서는 Perplexity의 주요 기능과 활용 방법, 그리고 다양한 활용 사례를 알아보겠습니다.Perplexity란 무엇인가?Perplexity는 인공지능과 실시간 웹 검색을 결합한 '앤서 엔진(Answer Engine)'입니다. 사용자가 질문을 입력하면 AI가 실시간으로 웹에서 관련 정보를 수집, 분석하여 종합적인 답변을 제공합니다. 특히 최신성과 신뢰성이 뛰어난데, 실시간으로 업데이트된 정보.. 2024. 10. 22.
카카오의 새로운 AI 메신저, '카나나': 그룹 대화에 최적화된 AI 메이트 카카오는 최근 열린 ‘이프카카오(if KAKAO)’ 컨퍼런스에서 새로운 AI 메신저 서비스인 '카나나(KANANA)'를 소개했습니다. 이 서비스는 기존 카카오톡 플랫폼에서 벗어나 별도의 애플리케이션으로 출시될 예정입니다. 카카오는 이를 통해 AI 기반 커뮤니케이션의 새로운 경험을 제공하고, 보다 정교한 사용자 맞춤형 기능을 구현할 계획입니다. 카카오톡이 아닌 독립 앱으로의 이유카카오의 이상호 리더는 카나나를 별도의 앱으로 출시하는 이유에 대해 설명했습니다. 기존의 카카오톡 틀을 유지하면서도 새로운 기능을 더하기 위해서는 완전히 다른 접근이 필요하다는 것이 주된 이유였습니다. 특히 사용자 인터페이스(UI), 경험(UX), 보안 등 다양한 측면에서 차별화된 서비스를 제공하기 위해 독립적인 앱으로 출시를 결정.. 2024. 10. 22.
미드저니, 텍스트로 지시하고 편집하는 '포토샵' 출시! AI로 손쉽게 수정 미드저니(Midjourney)가 기존 생성 인공지능(AI) 기술을 한 단계 더 발전시키며, 이미지 편집 기능을 확대했습니다. 이제 사용자는 미드저니를 통해 모든 웹 이미지를 텍스트 설명으로 간편하게 편집할 수 있게 되었습니다. 이는 기존에 미드저니가 자체 생성한 이미지에만 적용되었던 편집 기능을 넘어서는 중요한 업데이트로, 이미지 생성과 편집의 활용 범위가 대폭 확장될 전망입니다.미드저니의 이미지 편집기: 무엇이 달라졌나?이번 업데이트의 핵심은, 텍스트 프롬프트로 이미지를 편집할 수 있다는 점입니다. 마치 어도비 포토샵을 사용하는 것과 같은 효과를 제공하지만, 차이점은 사용자가 이미지를 수정하거나 재구성하기 위해 복잡한 소프트웨어를 배우지 않아도 된다는 것입니다. 텍스트로 원하는 내용을 설명하면, AI가.. 2024. 10. 22.
스캐터랩의 AI 플랫폼 ‘제타’, 출시 6개월 만에 100만 명 이용자 돌파 국내 AI 챗봇 서비스 중 가장 빠르게 성장 중인 스캐터랩의 AI 플랫폼 ‘제타(zeta)’가 출시 6개월 만에 누적 이용자 100만 명을 돌파했습니다. 21일 스캐터랩은 이 같은 기록을 공개하며, 특히 10대와 20대 젊은 층을 중심으로 높은 사용률을 기록하고 있다고 밝혔습니다.제타의 인기 비결은 무엇일까요? 단순한 챗봇 기능을 넘어 스토리텔링 콘텐츠 생성에 특화된 점이 젠Z 세대의 관심을 끌고 있습니다. 제타는 사용자들이 오리지널 캐릭터를 생성하고 이 캐릭터들과 자유롭게 대화할 수 있는 AI 플랫폼으로, 다양한 창작 활동을 지원해 창의적인 콘텐츠 제작이 가능합니다.제타(zeta) - 상상이 현실이 되는 AI 채팅 - App Store 다운로드제타(zeta) - 상상이 현실이 되는 AI 채팅 - Goo.. 2024. 10. 22.
미드저니의 고급 워크플로우(이미지 생성 과정) 따라 해보기 미드저니의 고급 워크플로우(이미지 생성 과정) 오늘은 미드저니의 고급 기능을 이용한 워크플로우(이미지 생성 과정)을 보여드리려 합니다. 이번에도 간단한 프롬프트로 이미지를 생성해보도록 합니다.미드저니 홈페이지 상단에 있는 프롬프트 창에 머리속에 상상하는 단어들을 나열해 봅니다.    상상하세요! 나머지는 미드저니에게 맡기세요!!   A beautiful girl in the morning. Arrived at the clear lake. The scenery is beautiful, the mountains in the distance go, and the sunrise rises아침의 아름다운 소녀. 맑은 호수에 도착했습니다. 풍경은 아름답고, 멀리 산은 가고, 일출이 떠오른다  생성된 4장의 사진 중.. 2024. 10. 21.
AI 시대 미디어의 진화속에 우리가 준비해야 할 변화와 도전 최근 인공지능(AI)의 발전과 그로 인한 사회적 변화에 대해 많은 논의가 이루어지고 있습니다. 특히, AI는 이제 단순한 기술적 도구가 아니라, 인간 사회의 여러 측면에 강력한 영향을 미치며 미디어의 본질과 역할에도 새로운 패러다임을 제시하고 있습니다. 이 글에서는 AI와 미디어의 관계, 그 변화의 속도와 방향, 그리고 우리가 준비해야 할 중요한 도전 과제에 대해 다루어 보겠습니다. https://www.youtube.com/watch?v=fFIlEGnziMg 1. AI와 미래에 대한 도전적 과제AI의 발전 속도는 가히 눈부십니다. 그러나 그 속도가 빠른 만큼, 새로운 기술을 이해하고 받아들이는 데에는 도전이 따릅니다. 한 발표자는 이를 "달리는 차의 바퀴를 교체하는 것"과 같다고 표현하며, AI의 발전.. 2024. 10. 21.
퍼플렉시티, AI 검색의 새로운 가능성 열다: 내부 정보와 웹을 통합한 RAG 서비스 출시 https://www.youtube.com/watch?v=LqKZAHeCkEg 퍼플렉시티(PERPLEXITY)가 AI 검색 시장에서 혁신적인 새 서비스를 출시했습니다. 이제 기업들은 퍼플렉시티의 AI 검색을 통해 내부 문서와 웹상의 데이터를 동시에 검색할 수 있게 되었는데, 이 기능은 특히 검색 증강 생성(RAG, Retrieval-Augmented Generation) 기술을 사용해 기업들이 더 효율적이고 정확하게 필요한 정보를 얻을 수 있도록 도와줍니다.퍼플렉시티의 새로운 서비스: '내부 지식 검색'과 '퍼플렉시티 공간'퍼플렉시티는 최근 '내부 지식 검색 및 공간(Internal Knowledge Search)' 그리고 '퍼플렉시티 공간(Spaces)'이라는 두 가지 새로운 서비스를 발표했습니다. 기.. 2024. 10. 21.
머스크 xAI, 다국어 AI 라벨러 대규모 채용 한국어 포함... 그록-3 서비스 확대 전망 최근 일론 머스크가 이끄는 xAI가 다국어 AI 모델 학습을 위한 대규모 데이터 라벨러를 채용하고 있습니다. 이번 채용에는 한국어를 포함한 14개 언어가 새롭게 추가되면서, xAI의 새로운 대형언어모델(LLM) '그록-3'의 서비스 확대 가능성이 주목받고 있습니다.xAI, AI 라벨러 채용 공고 공개 xAI는 공식 웹사이트를 통해 'AI 튜터(AI Tutor)'라는 직무를 소개하며, 다양한 언어를 능숙하게 다루는 인재를 찾고 있다고 발표했습니다. AI 튜터는 고품질의 데이터를 생성하여 AI 모델 학습을 돕는 역할을 수행하며, 이는 데이터 라벨링 작업과 밀접한 연관이 있습니다. 특히, 이번 공고에서는 영어 외에도 한국어, 일본어, 중국어, 독일어 등 총 14개의 새로운 언어가 포함되어, 그록-3의 글로벌 .. 2024. 10. 21.
젠틀몬스터 x 철권 8 AI 콜라보: 혁신적인 AI 마케팅의 새로운 장 글로벌 패션 아이웨어 브랜드 젠틀몬스터(Gentle Monster)와 인기 3D 격투 게임 철권 8(Tekken 8)이 이색적인 콜라보를 선보이며 큰 화제를 모으고 있습니다. 이번 콜라보는 단순한 아이웨어 협업을 넘어, 인공지능(AI) 필터를 활용한 독창적인 사용자 경험(UX)을 제공하여 많은 사람들의 관심을 끌고 있습니다. 젠틀몬스터는 AI 기술과 패션을 접목시켜 새로운 방식의 마케팅 인터페이스를 만들어내며, 그 가능성을 확장하고 있습니다. 모바일 및 PC 홈페이지1. 젠틀몬스터 ‘인페르노’ 선글라스: 철권 캐릭터에서 영감받은 디자인이번 협업의 핵심 제품은 젠틀몬스터가 선보인 한정판 선글라스 ‘인페르노(Inferno)’입니다. 이 제품은 철권 8의 캐릭터 카즈야(Kazuya)의 데빌 버전에서 영감을 받.. 2024. 10. 21.
미드저니의 기본 워크플로우(이미지 생성 과정) 따라 해보기 미드저니의 기본 워크플로우(이미지 생성 과정) 오늘은 미드저니의 기본 기능을 이용한 워크플로우(이미지 생성 과정)을 보여드리려 합니다.  우선 간단한 프롬프트로 이미지를 생성해보도록 합니다.미드저니 홈페이지 상단에 있는 프롬프트 창에 머리속에 상상하는 단어들을 나열해 봅니다.     상상하세요! 나머지는 미드저니에게 맡기세요!!   Sunny weather, white samoyed sticking its head out of a moving car window, fur blowing in the breeze, stock photo style symbolizing the fun and excitement of family travel맑은 날씨, 움직이는 차창 밖으로 고개를 내밀고 있는 하얀 사모예드, 털.. 2024. 10. 20.
테슬라 로보택시, 옵티머스 발표: 우리가 테슬라를 주목해야 하는 이유 테슬라, 전기차, 자율주행, 로보택시, 옵티머스로봇, 메가팩, 에너지솔루션, FSD, 지속가능한에너지, 일론머스크테슬라(Tesla)는 전기차를 넘어, 자율주행, 로봇, 에너지 솔루션 등 다양한 분야에서 혁신적인 기술을 선보이며 글로벌 산업의 판도를 바꾸고 있습니다. 이제 테슬라는 단순히 전기차 제조업체가 아니라, 미래의 모빌리티와 기술 생태계를 선도하는 기업으로 자리 잡았습니다. 이번 글에서는 테슬라가 왜 2025년에 더 주목받게 될지에 대한 주요 이유를 살펴보겠습니다.↓↓↓↓↓↓↓테슬라 로보택시 생중계 바로보기 버튼을 눌러 지금 확인하세요!!1. 로보택시: 자율주행의 미래테슬라는 2025년을 목표로 로보택시 서비스를 상용화하려고 합니다. 로보택시는 자율주행 기술을 기반으로 사람이 운전하지 않아도 스스로.. 2024. 10. 20.
메타의 새로운 AI 음성 모델: 인간의 감정을 담은 AI 비서의 등장!!! 최근 메타(Meta)가 혁신적인 AI 음성 모델을 출시하며 화제를 모으고 있습니다. 이제 AI 비서도 인간과 같은 감정과 톤을 가진 목소리를 낼 수 있게 되었는데요, 이는 기존의 음성 합성 기술을 뛰어넘는 발전으로, AI와 인간의 상호작용을 더 자연스럽게 만듭니다. 메타의 새로운 멀티모달 모델(LMM), 메타 스피릿 LM(Meta Spirit LM)에 대해 알아보겠습니다.  메타 스피릿 LM: 베이스와 익스프레시브 두 가지 버전메타가 발표한 스피릿 LM은 두 가지 버전으로 구성되어 있습니다.스피릿 LM 베이스(Spirit LM Base):기본적인 음성 전환 기능을 제공하는 모델로, 간단한 음성-텍스트 변환 작업에 적합합니다. 기존의 TTS(텍스트-음성 변환)와 비슷한 방식이지만, 메타의 독자적인 기술을 .. 2024. 10. 20.
미드저니를 배워야 하는 이유: 디자이너를 위한 필수 AI 툴 최근 인공지능(AI) 기술의 발전으로, 이제 누구나 손쉽게 고퀄리티의 그래픽 이미지를 생성할 수 있게 되었습니다. 그 중심에는 미드저니(MidJourney)가 있습니다. 미드저니는 초보자부터 전문가까지 누구나 쉽게 사용할 수 있는 생성형 AI 툴로, 창의적이고 독창적인 이미지 생성에 최적화되어 있습니다. 이번 글에서는 왜 미드저니를 배워야 하는지에 대한 이유와 그 활용 방법에 대해 알아보겠습니다.  미드저니 지금 시작하기 버튼을 눌러 지금 시작하세요!!1. 미드저니는 쉽고 간편하게 사용할 수 있습니다.미드저니는 복잡한 설치 과정이 없습니다. 디스코드를 통해 간편하게 접속할 수 있고, 최근에는 웹사이트 버전도 출시되어 더 많은 사용자들이 접근하기 쉬워졌습니다. AI 도구를 처음 사용해보는 사람도 금방 익힐.. 2024. 10. 19.