ChatGPT回答超过一半的软件工程问题都是错误的

ChatGPT回答错误的软件工程问题超过一半

.fav_bar { float:left; border:1px solid #a7b1b5; margin-top:10px; margin-bottom:20px; } .fav_bar span.fav_bar-label { text-align:center; padding:8px 0px 0px 0px; float:left; margin-left:-1px; border-right:1px dotted #a7b1b5; border-left:1px solid #a7b1b5; display:block; width:69px; height:24px; color:#6e7476; font-weight:bold; font-size:12px; text-transform:uppercase; font-family:Arial, Helvetica, sans-serif; } .fav_bar a, #plus-one { float:left; border-right:1px dotted #a7b1b5; display:block; width:36px; height:32px; text-indent:-9999px; } .fav_bar a.fav_de { background: url(../images/icons/de.gif) no-repeat 0 0 #fff } .fav_bar a.fav_de:hover { background: url(../images/icons/de.gif) no-repeat 0 0 #e6e9ea } .fav_bar a.fav_acm_digital { background:url(‘../images/icons/acm_digital_library.gif’) no-repeat 0px 0px #FFF; } .fav_bar a.fav_acm_digital:hover { background:url(‘../images/icons/acm_digital_library.gif’) no-repeat 0px 0px #e6e9ea; } .fav_bar a.fav_pdf { background:url(‘../images/icons/pdf.gif’) no-repeat 0px 0px #FFF; } .fav_bar a.fav_pdf:hover { background:url(‘../images/icons/pdf.gif’) no-repeat 0px 0px #e6e9ea; } .fav_bar a.fav_more .at-icon-wrapper{ height: 33px !important ; width: 35px !important; padding: 0 !important; border-right: none !important; } .a2a_kit { line-height: 24px !important; width: unset !important; height: unset !important; padding: 0 !important; border-right: unset !important; border-left: unset !important; } .fav_bar .a2a_kit a .a2a_svg { margin-left: 7px; margin-top: 4px; padding: unset !important; }

用户经常无法识别ChatGPT答案的错误或低估错误程度。 ¶来源:Getty Images

根据普渡大学的研究,ChatGPT错误回答了517个Stack Overflow问题中的52%,其回答中有77%是不必要的冗长。

研究发现,ChatGPT对软件工程问题给出了全面的答案,65%的时间都涉及到问题的各个方面。

研究人员还要求12名具有不同编程技能水平的人评估ChatGPT生成的答案。研究人员表示:“用户忽视ChatGPT答案中的错误信息[39.34%的时间],是因为ChatGPT答案中包含了全面、清晰和人类化的见解。”

来源:ZDNet 完整文章

摘要版权 © 2023 SmithBucklin,华盛顿特区,美国