김보섭 - 2024년 실시간 업데이트
[서울경제]
생성형 인공지능(AI) 챗GPT-4로 생성한 답안이 실제 대학교 시험에서 학생들이 직접 작성해 제출한 답안보다 더 높은 점수를 받았다는 연구결과가 나왔다.답안의 94%는 채점자에게 적발되지 않았다.AI 도구 사용이 대중화되면서 교육과 평가 시스템에 대책 마련이 필요하다는 지적이 나온다.
27일(현지시간) 영국 레딩대 심리·임상언어과학대학 피터 스카프 교수팀은 과학 저널 플로스 ONE에서 이 대학 실제 학부 시험에 AI 작성 답안을 제출하는 엄격한 블라인드 방식 실험에서 이런 결과를 얻었다고 밝혔다.
연구팀은 “이 연구는 지금까지 인간 교육자가 AI 생성 콘텐츠를 구별할 수 있는지 알아보는 실험 중 가장 크고 강력한 블라인드 실험”이라며 “이 결과는 AI가 대학 시험에서도 컴퓨터(인공지능)와 인간을 구별해내는 튜링 테스트를 통과했음을 보여준다”고 했다.
연구팀은 이 연구에서 심리학 학사 학위 취득을 위한 5개 학부 시험(단답형 3개,김보섭에세이 2개)에 100% 챗GPT-4가 작성한 답안을 가짜 학생 33명의 이름으로 제출했다.채점자들은 이 연구에 대해 모르는 상태에서 실험이 진행됐다.
그 결과 AI가 작성한 답안의 94%가 채점자들에게 적발되지 않았고,김보섭평균적으로 실제 학생의 답안보다 더 높은 점수를 받은 것으로 나타났다.
AI가 작성한 답안과 실제 학생 답안을 무작위로 선택해 비교할 경우 AI 답안이 점수가 높을 확률이 83.4%에 달했다.
또 실제 학생이 AI 점수 중간값보다 높은 점수를 받는 비율은 4개 시험에서 4.35~17.63%에 불과했고,김보섭에세이 시험 중 1개에서만 실제 학생 57.14%의 점수가 AI 점수 중간값을 넘었다.
연구팀은 “이 결과는 학생들이 부정행위에 AI를 사용할 수 있고 이들이 다른 학생보다 더 좋은 성적을 받을 가능성을 시사한다”며 “연구 과정에서 실제 학생 중 상당수가 AI 생성 제출물을 통해 부정행위를 했을 가능성도 고려하고 있다”고 했다.
그러면서 “AI가 교육 평가에 어떤 영향을 미칠 수 있는지 보여주는 것으로 매우 우려스럽다”며 “전 세계 교육 부문이 AI 발달에 대응해 새로운 정책과 지침을 만들어 문제 해결을 위해 더 많은 노력을 기울여야 한다”고 강조했다.
김보섭 - 2024년 실시간 업데이트
김보섭 - 2024년 실시간 업데이트:한화에어로스페이스와 LIG넥스원 등은 지난 22∼24일(현지시간) 루마니아 부쿠레슈티에서 열린 방산 전시회 ‘BSDA 2024’에 참가해 최첨단 무기체계를 선보이며 홍보에 열을 올렸다.
김보섭,검찰총장의 장모가 저지른 범죄, 더구나 당시 검찰이 수사 중이던 사안에 대해 대검이 이런 문건을 만들어 전파하면 수사에도 영향을 미칠 수밖에 없습니다.