本文提出了一種名為 JFuzz 的方法,利用大型語言模型 (LLM) 來增強 JSON 解析器的測試,旨在發現潛在的錯誤並識別不同解析器之間的行為差異。
대규모 언어 모델(LLM)을 활용하여 JSON 파서 퍼징 프레임워크를 개선하여 테스트 케이스와 변이를 생성하고, 잠재적인 버그를 발견하고 다양한 파서 간의 동작 차이를 식별하는 방법을 제시합니다.
本稿では、大規模言語モデル(LLM)を用いてJSONパーサーの潜在的なバグと挙動の多様性を検出する新しいファジング手法「JFuzz」を提案する。
本稿では、コード関連タスクの品質、特に「有用性」を評価するための、自動生成されたベンチマークとLLM(Large Language Model)を用いた評価手法を提案する。
본 연구는 새롭게 구축된 CVE 기반 벤치마크 및 기존 합성 벤치마크를 활용하여 11가지 무료 안드로이드 SAST 도구의 성능을 분석하고, 도구 개발자와 사용자에게 실질적인 제안을 제공합니다.
Crux 是一種用於 Rust 和其他語言(如 C/LLVM)的跨語言驗證工具,它建立在與成熟的 SAW-Cryptol 工具鏈相同的框架之上,但提供了一個以符號單元測試形式表達證明的介面,旨在驗證對人類而言難以確保正確性的程式碼,例如加密模組和序列化/反序列化器對。
Crux는 복잡하고 안전이 중요한 코드를 검증하는 데 효과적인 기법인 구성적 기호 시뮬레이션을 사용자 친화적인 인터페이스로 제공하여 Rust 및 기타 언어로 작성된 소프트웨어의 안전성과 신뢰성을 향상시키는 것을 목표로 합니다.
Cruxは、RustやC/LLVMなどの言語に対応した、複雑なコードの正確性を検証するためのツールであり、特に暗号化モジュールやシリアライザ/デシリアライザペアなどの、人間にとってエラーを起こしやすいコードの検証に適しています。
Crux is a new cross-language verification tool that leverages symbolic testing and compositional reasoning to verify the correctness of intricate, bounded code, such as cryptographic modules and serializers/deserializers, against executable specifications written in languages like Cryptol and hacspec.
CASET is a novel tool that leverages dynamic execution traces and unsupervised machine learning to automatically analyze the time complexity of student code submissions, enabling efficient and effective grading in CS1/CS2 courses.