챗GPT 음성 대화 가능해졌습니다. 질문자가 이미지를 보여주고, 질문하면 챗봇이 음성으로 답해주는 기술입니다. 다양한 목소리 구현도 가능하고, 실제 질문자 목소리도 비슷하게 구현이 가능합니다. 수학 문제를 이미지로 올리고 질문하면 과외 선생처럼 풀이를 알려줍니다. 다만 딥보이스 악용 우려가 있습니다.
챗GPT 음성 대화 가능
오픈 AI는 챗봇이 이미지를 질문자가 음성으로 물어보면 음성으로 답하는 기술을 선보였습니다. 자세히 설명을 하면 질문자가 이미지를 올려서 음성으로 질문을 하면 챗봇은 이를 텍스트로 변환하여 읽고 다시 텍스트로 답변을 하고, 이를 음성으로 알려주는 방식입니다.
단순히 질문에 대한 답변 정도가 아니라, 질문자의 음성을 단 몇 초만에 인식하여 비슷한 음성으로 답변도 할 수 있습니다. 또 음성 버전을 여러 가지를 선택하여 대화를 할 수 있습니다. 질문자가 요구하는 수준에 답변도 가능합니다.
이 새로운 기술은 우선 2주 안에 유료 버전으로 배포하고, 차후에 무료로 모두에게 제공할 생각입니다. 물론 수익 모델로 광고를 어떻게 할지는 아직 알 수 없습니다.
이미지 보고 듣고 말하기
이번 챗GPT 특징은 사용자가 궁금한 이미지를 올리고, 이를 챗봇이 이미지를 보고, 질문자의 음성을 듣고 음성을 답변하는 방법입니다. 그러니깐 일부러 텍스트를 써서 불편하게 질문을 하는 것이 아니라 말로 질문이 가능하다는 것입니다. 또 여기서는 여러 가지 언어로 변환하여 질문도 답변도 가능합니다.
구체적으로 말하면 챗GPT에 수학 문제를 이미지로 올리고 사용자가 질문을 하면 챗봇이 이를 파악하고 질문자의 성향에 맞게 수학 문제 풀이를 음성으로 답하는 것입니다. 이는 거의 과외 수준입니다. 만약 학생 수준에 맞춰서 챗봇이 답변을 한다면 이는 과외나 학원에 큰 타격을 줄 수 있습니다.
수학 문제만 물어보는 것이 아닙니다. 예를 들어 엑셀을 하다가 궁금한 것이 있다면 스크린 샷을 하여 이미지를 올려서 질문을 하면 답변을 줄 수 있습니다. 이는 엑셀을 시작으로 컴퓨터 하드웨어 문제, 소프트웨어 오류 문제 등을 챗봇에 물어보고 답변을 음성으로 들을 수 있습니다.
챗GPT 음성 대화 사실상 놀라운 기술입니다. 아마 이 기술이 상용화되거나 대중화가 된다면 사라질 직업이 한 두 개가 아닐 것 같습니다. 그런데 문제는 없을지 의문입니다. 어떤 문제가 있을까요?
음성 대화 문제점
챗GPT 음성 대화 문제점은 챗봇이 질문자의 음성을 단 몇 초 만에 그대로 복제가 가능합니다. 이를 토대로 딥보이스가 가능합니다. 즉 딥보이스는 보이스 피싱은 물론이고 사이버 범죄에 악용될 소지가 있습니다.
또 기술적인 문제는 어느 정도 답이 있지만 조금 난해한 것은 답변이 어렵습니다. 예를 들어 문학 문제를 물어보거나, 사회 정치 문제를 물어본다면 비 전문가가 전문가 행사를 내고 가짜 뉴스를 알려줄 수 있습니다.
사실 뉴스를 바탕으로 만드는 질문들은 찬성과 반대 의견이 다양하기 때문에 정답이 없습니다. 오히려 비전문가의 답변이 마치 많이 거론되고 노출이 되어 정답처럼 악용될 수 있습니다.
정답이 있는 수학 문제나 기술적인 문제는 충분히 답변이 가능하지만 챗GPT 음성 대화 문제는 질문자의 음성을 딥보이스 할 수 있고, 가짜 뉴스를 진짜처럼 만들 수 있는 단점이 있습니다. 이를 정말 보완하여 제대로 챗봇이 질문하고 답변할 수 있을지 의문입니다.
하지만 답이 있는 기술적인 문제에 대해서 이미지를 올리고 음성으로 물어본다면 확실한 답변을 들을 수 있습니다. 다만 사용자의 수준이나 취향 또는 성격에 맞는 답변을 정확히 할 수 있는지는 더 두고 봐야 될 것 같습니다.
챗GPT 음성 대화 혁신적인 발전이지만 넘어야 할 산이 많습니다. 사회 정치를 다루는 뉴스는 되도록 허용하지 않았으면 합니다.