라벨이 chatGPT인 게시물 표시

MYSQL에서 제공하는 Vector Data 처리기능

이미지
  MYSQL에서 제공하는 Vector Data 처리기능 MySQL은 벡터 데이터 처리 기능을 내장하여 AI 기반 애플리케이션 개발을 지원합니다. 아래는 주요 기능과 사용 예시, 기존 벡터 DB 대비 장점을 정리한 내용입니다.     MySQL의 Vector DB 기능 1. 벡터 데이터 타입 지원 VECTOR(n) : n차원 벡터 저장 가능 (예: VECTOR(768) )[2][5]. 저장 방식 : VARBINARY 또는 리스트 형식 문자열로 4바이트 부동소수점 저장[2]. 크기 제한 : 2048~16383 차원 지원 (기본값 2048)[2].   2. 벡터 변환 함수 STRING_TO_VECTOR() : 문자열을 벡터로 변환 (예: '[1][2][3]' → 이진값)[2][5]. VECTOR_TO_STRING() : 이진 벡터를 문자열로 출력[2]. VECTOR_DIM() : 벡터의 차원 수 계산[2].   3. 유사도 계산 DISTANCE() : 코사인/유클리드/내적 유사도 계산 지원[2]. SELECT DISTANCE(embedding, '[1,2,3]' , 'COSINE' ) FROM books;     4. 벡터 연산 통합 표준 SQL 구문 : INSERT , UPDATE , JOIN 등 기존 SQL 문법과 호환[2][5]. 예시 테이블 생성 : CREATE TABLE books ( id INT PRIMARY KEY, title VARCHAR ( 60 ), embedding VECTOR( 768 ) USING VARBINARY );     사용 예시 1. 벡터 데이터 삽입 INSERT INTO books (title, embedding) VALUES ( 'AI 입문서' , STRING_TO_VECTOR( '[0.1,0.4,0.7]' ));   2. 유사도 검색 ...

인공지능의 미래 : 인간보다 더 인간적인 (The Creator 2023) 인공지능의 세계 미래에 어떻게 올 것인가?

이미지
오늘은 미래에 대한 내용을 영화를 더불어 작성해 봅니다. 지금 세상이 제대로 갈 것 같은지, 지금 사회 초년생 혹은 초중고 생들에게 다가올 미래는 어떻게 될 것인지 우려스러운 것도 보입니다.   [영화로 보는 미래의 삶] The Creator (2023)은 인공지능의 미래를 배경으로 하는 영화입니다. 인공지능이 인간의 생활에서 생산부터 치안까지 인간의 모든 생활을 즐겁고 안정적인 환경으로 만들어 줄 것 같습니다.   인간은 노동과 노동의 댓가를 통해 돈을 벌고 생활을 하는데 어떻게 재산을 축적할지도 궁금하기도 합니다. 다만 영화를 통해 우리의 미래가 인공지능으로 인해 그만큼 밝지도 좋지도 않을 것이다는 것을 많이 생각하게 합니다. 인공지능을 소재로한 많은 영화들을 많이 보셨을 듯합니다. 터미네이터(1984년)에서는  인간의 전쟁을,  메트릭스(2000)를 통한 메타버스 같은 사이버세상을 그리고 써로게이트(2009) 같은 휴머노이드 등등 많은 영화들이 미래에 다가올 우리의 삶은 어둡게 조영하고 있습니다.   인공지능하면 떠오르는 영화중의 영화를 뽑은다면 터미네이터(1984년)이라고 봅니다. 아마도 인공지능을 가진 기계 인간과 더불어 미래의 타임머신까지 인간이 상상으로 접할 수 있는 모든 것을 잘 보여준 영화입니다.  영화 내내 공포스럽고 긴장감을 놓칠 수 없는 시나리오는  항상 다음 시리즈를 기대하게 만들었던 것 같습니다.   터미네이터 시리지는 다양한 시나리오로  1984년 개봉한 터미네이터 시리지는 터미네이터 (The Terminator, 1984),  터미네이터 2: 심판 날 (Terminator 2: Judgment Day, 1991), 터미네이터: 다크 페이트 (Terminator: Dark Fate, 2019), 사라코너연대기 등 많은 작품들로 이어져 있어서 지금 봐도 재미있을 듯합니다. 터미네이터-인공지능-기계인간 ...

인공지능 GPT를 이해하는데 알아야 하는 용어들

이미지
[인공지능 GPT를 이해하는데  알아야 하는 용어들] GPT(Generative Pre-trained Transformer) LangChain LLM (Large Language Model, 거대 언어 모델) Vector Embedding(벡터 임베딩) Vector Database (벡터 데이터베이스) Tokenize (토큰화)     ■ GPT(Generative Pre-trained Transformer)   ChatGPT는 OpenAI에서 개발한 대화형 인공 지능 언어 모델입니다. GPT(Generative Pre-trained Transformer) 시리즈에 기반하고 있으며, 방대한 양의 텍스트 데이터를 사전 훈련하여 다양한 언어 작업을 수행할 수 있는 능력을 갖추고 있습니다.   ChatGPT는 사용자와 자연스러운 대화를 수행하며, 주어진 문맥에 따라 응답을 생성합니다. 이 모델은 이전 대화의 맥락을 이해하고 다양한 주제에 대해 토론하거나 정보를 제공할 수 있습니다. 또한 사용자의 언어 스타일을 학습하여 대화를 보다 자연스럽게 유지하려 노력합니다.   GPT-3.5, 혹은 그 이후의 버전을 기반으로 하는 ChatGPT는 매우 큰 규모의 모델로, 다양한 분야에서의 대화와 질문에 대응할 수 있습니다     ■  LangChain   LangChain은 개발자가 LLM(Large Language Model)을 이용해 엔드투엔드 애플리케이션을 구축할 수 있도록 설계된 강력한 프레임워크입니다.     ■  LLM (Large Language Model, 거대 언어 모델) LLM(Large Language Model)은 대규모 언어 모델로,  언어모델(LM)을 ...

데이터 과학과 프롬프트 엔지니어링 - SingleStore를 이용한 벡터DB

이미지
데이터 과학과 프롬프트 엔지니어링 - SingleStore를 이용한 벡터DB 데이터 과학과  프롬프트 엔지니어링   chatGPT로 인해 앞으로 인공 지능의 영역은 다음 두가지 영역으로 나누어 접근 할 수 있습니다.   -  데이터 과학(학문적/전문성)  :    학문적이고 전문성을 요구로 하는 인공지능 전문 분야 (머신러닝, 딥러닝의 데이터 분석)   - 프롬프트 엔지니어링 (생성형 AI 서비스대중화) :   AI 민주화에 따른  대중화된 서비스 AI 응용 개발 분야 ( LLM을 기반으로 서비스에 활용)   최근 몆년 동안  AI 분야는 데이터 과학(Data Science)라고 하면서  대규모 머신 장비와 고급 기술자(데이터사이언티스트)를 투입하여 방대한 데이터를 분석하는데 활용 했습니다. 이는 학문적이고 전문가에 의한 인공지능 분야으로 데이터 분석 분야가 대부분을 차지해 왔습니다.   chatGPT와 같은 프롬프트 엔지니어링 분야는 이제는 이러한  데이터사이언스 (Data Science)를 기반으로한 인공지능 영역과 별개로  인공지능을 이용한 생활의 편의기능 또는 문서, 언어의 특성을 이해하고 만들어진 LLM을 기반으로  대중화된 생성형 AI 서비스 영역이 부각 되고 있습니다.   chatGPT의 등장으로 AI민주화라는 용어가 현실화 되었습니다. 지금 인터넷 서비스 전반에서 AI를 활용하는 움직임을 엄청난 변화로 보입니다.  지금이야 말로 인공지능의 부흥기라고 여겨 질 만큼 많은 기업들이 AI는 서비스의 필수조건으로 인식 하고 있습니다.      오늘은 이러한 변화에서 지속적인 기술을 접목할 수 있는 SingleStore DBMS를 소개 하고자 합니다.       AI민주화를 위한 차세대 DBMS SingleStoreDB   Si...

이 블로그의 인기 게시물

[좋은글] 나침반의 바늘이 흔들리는 한 그 나침반은 틀리는 일이 없다 - 신영복

( 경영전략,사업전략 ) 마이클 포터의 가치사슬 분석(Value Chain Analysis) 이론

[Ubuntu]Linux Tunning -네트워크 커널 매개 변수 최적화