エッジデバイスに適した軽量かつ効率的なXceptionアーキテクチャを提案し、Depthwise Separable ConvolutionとDeep Residual Convolutionを組み合わせることで、パラメータ数、メモリ使用量、計算負荷を削減しながらも、従来のXceptionアーキテクチャを超えるパフォーマンスを実現する。
Contrastive Language Prompting (CLAP), utilizing both positive and negative prompts, enhances the accuracy of medical anomaly detection in Visual-Language Models by mitigating false positives.
본 논문에서는 자율주행 및 커넥티드 차량 (ACV) 플래툰의 측면 안정성을 확보하기 위해 리드 차량뿐만 아니라 선행 차량의 정보까지 활용하는 새로운 측면 제어 프레임워크를 제안합니다.
本稿では、ストリーミング可能な動的シーンのオンライン再構成における学習効率、レンダリング速度、ストレージ効率の課題に対処するため、階層的コヒーレントモーション(HiCoM)フレームワークを提案する。
This paper proposes a modified Xception architecture, incorporating depthwise separable convolutions and deep residual connections, to optimize the model for deployment on edge devices while maintaining competitive performance in object detection tasks.
本文提出了一種名為 HPM 的新型電影配樂生成框架,該框架利用潛在擴散模型,根據電影片段生成與其情感和語義相匹配的音樂,並能進一步根據特定作曲家的風格進行音樂生成。
HiCoM is a novel framework for efficient online reconstruction of streamable dynamic scenes that leverages a hierarchical coherent motion mechanism and continual refinement to achieve faster training, reduced storage, and competitive rendering quality compared to state-of-the-art methods.
本文分析了單層 Transformer 模型在 Softmax 和高斯注意力機制下的損失函數,發現儘管兩種機制在特定條件下都能夠透過梯度下降達到全局最優解,但 Softmax 注意力機制更容易陷入局部最優解,而高斯注意力機制則展現出更平滑的優化過程。
自動運転車両の隊列走行において、緊急レーンチェンジ(ELC)などの操縦時における隊列の横方向安定性を確保するために、先行車両だけでなく、リード車両の情報も利用した新しい横方向制御フレームワークを提案する。
본 논문에서는 새로운 영화 음악 데이터 세트와 ControlNet 기반 딥러닝 프레임워크를 사용하여 영화 장면에 어울리는 음악을 생성하고 특정 작곡 스타일을 모방하는 방법을 제시합니다.