InfiMM-HD: Ein großer Schritt in der hochauflösenden multimodalen Verständnis
InfiMM-HD ist eine neuartige Architektur, die hochauflösende Bilder effizient und kostengünstig verarbeitet, um die Leistung von Multimodal Large Language Models zu verbessern.