本文提出了一个新的挑战,即在特定领域大型语言模型中整合通用能力和领域知识,以提高在特定任务上的性能。
HAIGEN是一个人机协作辅助设计系统,允许设计师结合云端大模型和本地小模型来实现高效的设计流程。所有模型都可以进行个性化和微调,为设计师提供了追求个性化设计的用户友好体验。此外,云端和本地架构的集成确保了设计师创意的隐私稳定保护。
Java反编译的主要目的是提高代码理解,因此反编译代码的可读性非常重要。然而,之前的研究主要集中在反编译的正确性,而忽视了反编译代码的可读性。
PolicyCraft系统支持用户通过讨论和投票具体案例来协作提出、批评和修订政策。这有助于用户识别他们的分歧是源于政策措辞还是对具体案例的根本性分歧,并相应地讨论和解决这些分歧。
RAM2C是一个能够自动生成符合人性化交流、教学专业性和安全伦理要求的自由教育对话的框架。它通过组织不同角色的语言模型专家,并利用多源知识库进行检索增强,来生成高质量的教育对话数据,从而提升基础语言模型在自由教育对话中的性能。
通过结合视觉、音频和文本数据,提出ComHeat框架生成有影响力的热门评论,以提高短视频的曝光度和互动。
利用大型语言模型生成针对特定漏洞的优化初始种子语料库,可以显著提高有向灰盒模糊测试的效率和针对性。
本文提出了一种名为LoFI的方法,自动从日志中提取故障指示信息,包括故障指示描述(FID)和故障指示参数(FIP),以协助工程师进行故障诊断。
提出一种新的权重打包算法,可以最大限度地减少内存计算加速器中权重加载的开销,同时也能最大化计算资源的利用率。
ComplexCodeEval是一个新的基准,旨在评估大型代码模型在各种开发场景下的性能。该基准包含来自1,055个Java项目和2,107个Python项目的大量样本,涵盖了代码生成、代码补全、API推荐和测试用例生成等多个任务。通过实验,发现大型代码模型在复杂开发环境中仍存在局限性,且不同模型在不同任务和语言上的表现各不相同。此外,丰富的上下文信息和避免数据泄露对模型性能有重要影响。