Echtzeit-Erkennung und Lokalisierung von Harnleiteröffnungen in urologischen Endoskopie- und Operationsvideos
In der urologischen Endoskopie und Chirurgie ist die Erkennung und Lokalisierung der Harnleiteröffnung sehr wichtig. Da jedoch das Erscheinungsbild der Harnleiteröffnung von Person zu Person, von Zeit zu Zeit und aufgrund unterschiedlicher pathologischer Faktoren variiert, ist es manchmal schwierig, die Harnleiteröffnung genau zu lokalisieren und zu lokalisieren. Um verschiedene Arten von Harnleiteröffnungen in chirurgischen Videos automatisch zu identifizieren, schlägt dieser Artikel ein Deep-Learning-basiertes System zur Erkennung und Verfolgung von Harnleiteröffnungen vor. Das Framework besteht hauptsächlich aus drei Komponenten: dem Vorverarbeitungsteil, dem Ureteröffnungserkennungsmodell und dem Verfolgungsmodell. Für den Vorverarbeitungsteil wendet dieses Papier eine allgemeine Datenerweiterungsstrategie und eine spezifische Datenerweiterungsstrategie an, um die Vielfalt der Trainingsbeispiele zu erhöhen. Das Ureteröffnungserkennungsmodell (Refined-SSD) wird durch die Verbesserung des klassischen Modells Single Shot Multi Box Detector (SSD) im Bereich der Zielerkennung erhalten. Dann wurde Refined-SSD mit dem Verfolgungsalgorithmus CSRT verschmolzen, um das Erkennungs- und Verfolgungssystem für die Ureteröffnung zu bilden. In diesem Artikel verwenden wir nur Resektoskopbilder mit komplexeren Hintergrundinformationen, um das Erkennungsmodell zu trainieren, und verwenden dann Ureteroskopbilder zum Testen. Die experimentellen Ergebnisse beweisen, dass das mit Resektoskopbildern trainierte Modell erfolgreich auf andere Arten von urologischen Endoskopbildern angewendet werden kann, und seine Bewertungsindizes liegen alle bei etwa 0,9. Wir evaluieren das vorgeschlagene Erkennungsmodell auf den Resektoskop-Video- und Ureteroskop-Videodatensätzen weiter, und die Experimente zeigen, dass das vorgeschlagene Modell zur Erkennung der Harnleiteröffnung die Harnleiteröffnung in zwei verschiedenen Uroskopen in Echtzeit im Video identifizieren und lokalisieren kann. . Darüber hinaus haben wir in Resektoskop-Videosequenzen und Ureteroskop-Videosequenzen nicht nur die Leistung des vorgeschlagenen Erkennungs- und Verfolgungsmodells (Refined-SSD + CSRT) mit der eines einzelnen Erkennungsmodells verglichen, sondern auch mit anderen Erkennungsmodellen fusioniert. Die Auswirkungen von vier Verfolgungsalgorithmen werden verglichen, und die Experimente zeigen, dass das in diesem Artikel vorgeschlagene Erkennungs- und Verfolgungsmodell für die Ureteröffnung eine überlegene Leistung aufweist und eine durchschnittliche Erkennungsgeschwindigkeit von 20 ms pro Bild erreicht. Daher kann das Erkennungs- und Verfolgungsmodell Harnleiteröffnungen in Uroskopie-Operationsvideos genau und in Echtzeit identifizieren und lokalisieren.