제목 : AI가 촉발한 ‘데이터 근친교배’…‘가짜 트래픽’ 투성, ‘슬롭’만 넘친다 [AI 딥다이브]

출처 : 매경이코노미

링크 : https://v.daum.net/v/20260226210302509

요약 : 생성형 AI의 확산으로 인터넷이 AI가 만든 저질 콘텐츠와 가짜 트래픽으로 오염되고 있다는 우려가 커지고 있다. 이른바 ‘죽은 인터넷 이론’이 다시 주목받고 있으며, 실제로 웹 트래픽의 상당 부분이 인간이 아니라 자동화된 봇에 의해 만들어지고 있다는 분석도 나온다. 2024년 기준 자동화된 봇 트래픽이 전체 웹 트래픽의 51%를 차지해 처음으로 인간 활동을 넘어섰다. AI가 생성한 텍스트·이미지·영상이 대량으로 유통되면서 인터넷에는 이른바 ‘슬롭’이라 불리는 저품질 콘텐츠가 빠르게 늘어나고 있다. SNS에서는 AI가 만든 게시물에 또 다른 AI 봇이 댓글과 좋아요를 달아 확산시키는 사례도 나타나고 있으며, 쇼핑몰 후기나 온라인 콘텐츠에서도 AI가 만든 글이 늘고 있다. 이런 현상은 AI가 AI가 만든 데이터를 다시 학습하는 ‘데이터 근친교배’를 낳을 수 있으며, 그 결과 AI 모델의 품질이 점차 떨어지는 ‘모델 붕괴’ 가능성이 제기된다. 인간이 만든 다양한 데이터가 줄어들면 AI의 답변은 점점 단순하고 평균적인 형태로 변하고 오류나 환각 정보도 확대될 수 있다는 것이다. 전문가들은 이런 문제를 막기 위해 AI가 만든 콘텐츠와 인간이 만든 콘텐츠를 구분해 표시하고, 인간 창작 데이터의 공급을 늘리는 노력이 필요하다고 강조한다. 일부 기업들은 고급 작가나 창작자를 고용해 인간 중심의 데이터를 확보하려는 시도도 하고 있다.

내 생각 : 이전에 죽은 인터넷 이론과 유사한 이론을 책에서 접한적이 있는데, 그 이론은 SNS와 같은 인터넷에 살아있는 사람보다 죽은 사람이 더 많게 된다는 이론을 접했었다. 이번 기사를 보고 그런 유사한 이론인줄 알았는데, 시대가 바뀌어서 그런지는 잘 모르겠지만 이번엔 AI가 인간보다 더 많은 인터넷 트래픽을 이용한다는 이론인 것을 보고 꽤 놀라웠다. 물론, 크롤링과 같은 ‘긁어오기’ 작업이 다수라는 것은 알고 있지만, 그래도 인류가 이용하는 트래픽보단 적을것이라고 생각하였는데, 그게 아니라는 것이 신기했다. 2024년 기준으로도 51%인데, 생성형 AI가 대중화된 현재인 2026년엔 더 늘었을거라고 생각하니 약간 무서운 느낌도 들었다.

Leave a Reply

Your email address will not be published. Required fields are marked *