Curl error: Could not resolve: clients1.google.com (Could not contact DNS servers)
야구 직구 종류 - 2024년 실시간 업데이트
영국의 한 유명 대학에서 실시된 실험에서 GPT-4가 작성한 답안의 94%가 채점자들에게 적발되지 않았고,야구 직구 종류83%는 실제 학생의 답안보다 더 높은 점수를 받기까지 한 것으로 나타났습니다.
영국 레딩대 심리·임상언어과학대학 피터 스카프 교수팀은 오늘(27일) 과학 저널 플로스 ONE(PLoS ONE)에서 이 대학 실제 학부 시험에 AI 작성 답안을 제출하는 엄격한 블라인드 방식 실험에서 이런 결과를 얻었다고 밝혔습니다.
연구팀은 이 연구는 "인간 교육자가 AI 생성 콘텐츠를 구별할 수 있는지 알아보는 실험 중 가장 크고 강력한 블라인드 실험"이라고 말했습니다.
또,이 결과는 "AI가 컴퓨터(인공지능)와 인간을 구별해내는 튜링 테스트(Turing Test)를 대학 시험에서 통과한 것을 보여준다"고 말했습니다.
연구팀은 "AI 도구의 빠른 발전으로 AI를 이용한 과제나 시험 부정행위 우려가 커지고 있으나,야구 직구 종류AI가 생성한 텍스트를 감지하는 도구는 지금까지 그다지 성공적이지 못한 것으로 드러나고 있다"고 지적했습니다.
연구팀은 이 연구에서 심리학 학사 학위 취득을 위한 5개 학부 시험(단답형 3개,에세이 2개)에 100% 챗GPT-4가 작성한 답안을 가짜 학생 33명의 이름으로 제출했습니다.
채점자들은 이 사실을 알지 못했습니다.
그 결과,AI가 작성한 답안의 94%가 채점자들에게 적발되지 않았고,평균적으로 실제 학생의 답안보다 더 높은 점수를 받았습니다.
AI가 작성한 답안과 실제 학생 답안을 무작위로 선택해 비교할 경우 AI 답안이 점수가 높을 확률은 83.4%에 달했습니다.
또 실제 학생이 AI 점수 중간값보다 높은 점수를 받는 비율은 4개 시험에서 4.35~17.63%에 불과했고,에세이 시험 중 1개에서만 실제 학생 57.14%의 점수가 AI 점수 중간값을 넘었습니다.
연구팀은 "이 결과는 학생들이 AI를 활용해 부정행위를 하고,다른 학생보다 더 좋은 성적을 받을 가능성을 시사한다"고 말했습니다.
이어 "이 결과는 AI가 교육 평가에 어떤 영향을 미칠 수 있는지 보여주는 것으로 매우 우려스럽다"며 "전 세계 교육 부문이 AI 발달에 대응해 새로운 정책과 지침을 만들어 문제 해결을 위해 더 많은 노력을 기울여야 한다"고 강조했습니다.