Core Concepts
데빈 AI의 데모 비디오에는 중요한 제한점을 숨기고 과장된 기능을 보여주는 기법이 사용되었다.
Abstract
이 글은 데빈 AI의 제작사인 Cognition Labs가 데빈 AI의 역량을 과장하여 홍보하고 있다고 주장합니다.
먼저, 데빈 AI가 Upwork에서 과제를 수행하는 데모 비디오를 분석합니다. 이 비디오에서 데빈 AI는 과제 요구사항을 충족하지 못하고 오히려 자체적으로 버그를 만들어내는 것으로 나타났습니다. 또한 데빈 AI의 수행 속도도 매우 느린 것으로 확인되었습니다.
다음으로, 데빈 AI가 개발자가 발견하지 못한 버그를 찾아내고 수정하는 데모 비디오를 살펴봅니다. 이 비디오에서도 데빈 AI는 개발자가 제공한 기반 위에서 작업을 수행하는 것으로 나타나, 완전히 자율적인 소프트웨어 엔지니어로 보기는 어렵습니다.
이러한 사례들을 통해 저자는 Cognition Labs가 데빈 AI의 실제 역량보다 과장된 모습을 보여주고 있다고 지적합니다. 저자는 이러한 행태가 기술에 대한 과도한 열광과 허술한 검증을 초래할 수 있다고 우려합니다.
Stats
2016년 기준 평균 기업은 347.56TB의 데이터를 저장하고 있으며, 이로 인해 연간 700톤의 이산화탄소가 발생한다.
데빈 AI가 Upwork 과제를 수행하는 데 걸린 시간은 약 1시간이다.
Quotes
"Devin creates its own bugs. It fixes those bugs. Cognition completely omits this in their demo, making it seem like Devin was fixing issues with the system."
"The goal here isn't to tell you not to use it, but rather to highlight how one-sided media communications can be. Once you start to recognize techniques like cherry-picking, bait and switches, or strat to look for omissions in PR campaigns: it becomes easier to guard against the negative effects of hype."