logo
Να στείλετε μήνυμα
Wuhan Homsh Technology Co.,Ltd.
προϊόντα
Ειδήσεις
Σπίτι > Ειδήσεις >
Ειδήσεις επιχείρησης περίπου Η πρωτοποριακή ανακάλυψη της Homsh: ViT+ArcFace επιτυγχάνει 0,29% EER στην αναγνώριση ίριδας
Εκδηλώσεις
Επαφές
Επαφές: Mr. Kelvin Yi
Επαφή τώρα
Μας ταχυδρομήστε

Η πρωτοποριακή ανακάλυψη της Homsh: ViT+ArcFace επιτυγχάνει 0,29% EER στην αναγνώριση ίριδας

2026-04-01
Latest company news about Η πρωτοποριακή ανακάλυψη της Homsh: ViT+ArcFace επιτυγχάνει 0,29% EER στην αναγνώριση ίριδας

      Η Επαναστατική Ανακάλυψη της Homsh: ViT+ArcFace

      Η ακρίβεια αναγνώρισης ίριδας φτάνει στο κορυφαίο παγκόσμιο επίπεδο
      Με Ποσοστό Ίσου Σφάλματος (EER) μόλις 0,29% και ROC AUC να προσεγγίζει το θεωρητικό όριο —
      Επαναπροσδιορίσαμε τα όρια της αναγνώρισης ίριδας με το Vision Transformer
τα τελευταία νέα της εταιρείας για Η πρωτοποριακή ανακάλυψη της Homsh: ViT+ArcFace επιτυγχάνει 0,29% EER στην αναγνώριση ίριδας  0
▲ Το Vision Transformer επαναπροσδιορίζει το υποκείμενο παράδειγμα εξαγωγής χαρακτηριστικών ίριδας

I. Αυτή τη φορά, δεν είναι απλώς πρόοδος — είναι αλλαγή παραδείγματος

      Αν ρωτήσετε έναν μηχανικό που εργάζεται στην αναγνώριση ίριδας για δύο δεκαετίες: "Ποιο είναι το δυσκολότερο πρόβλημα που αντιμετωπίσατε ποτέ;"
      Πιθανότατα θα κάνει μια παύση και μετά θα πει: "Το Ελαστικό Φύλλο."
      Από τότε που ο John Daugman πρότεινε τον αλγόριθμο IrisCode το 1993, η διαδικασία "ξετυλίγματος του ελαστικού φύλλου" ήταν σαν μια επωδός χαραγμένη στο DNA των συστημάτων αναγνώρισης ίριδας παγκοσμίως. Ξετύλιγμα της κυκλικής ίριδας σε μια ορθογώνια εικόνα, στη συνέχεια εξαγωγή υφών χρησιμοποιώντας φίλτρα Gabor... αυτή η ροή εργασίας χρησιμοποιείται για τρεις δεκαετίες και κανείς δεν την αμφισβήτησε.
      Μέχρι που αποφασίσαμε να την πετάξουμε.

II. Γιατί σταμάτησε να λειτουργεί το Ελαστικό Φύλλο;

      Το Vision Transformer (ViT για συντομία) είναι μία από τις πιο εντυπωσιακές τεχνολογικές ανακαλύψεις στον τομέα της βαθιάς μάθησης τα τελευταία τρία χρόνια. Τέμνει μια εικόνα σε έναν αριθμό "περιοχών" 16x16, χρησιμοποιεί τον μηχανισμό αυτο-προσοχής των γλωσσικών μοντέλων για να κατανοήσει την παγκόσμια δομή της εικόνας και ξεπερνά τα συνελικτικά νευρωνικά δίκτυα (CNN) που κυριάρχησαν για χρόνια σε πολλαπλές κορυφαίες οπτικές εργασίες.
      Όταν προσπαθήσαμε αρχικά να εφαρμόσουμε το ViT στην αναγνώριση ίριδας, τα αρχικά αποτελέσματα ήταν απογοητευτικά: το Ποσοστό Ίσου Σφάλματος (EER) ήταν τόσο υψηλό όσο 4,65%, πολύ κάτω από τις προσδοκίες.
      Η ομάδα εντόπισε γρήγορα τη ριζική αιτία: το "Ελαστικό Φύλλο" "ισιώνει" την κυκλική ίριδα 64x512 pixel σε ένα ορθογώνιο, το οποίο στη συνέχεια κλιμακώνεται στην είσοδο 224x224 που απαιτείται από το ViT — μια κάθετη διάταση 3,5x και οριζόντια συμπίεση 2,3x. Η φυσική ακτινική/περιφερειακή δομή υφής της ίριδας παραμορφώθηκε σοβαρά, καθιστώντας αδύνατο για τον μηχανισμό προσοχής περιοχών του ViT να αντιληφθεί τη σημασιολογία εντός.
      Με άλλα λόγια: τροφοδοτούσαμε το πιο έξυπνο μοντέλο με λάθος τρόπο.
      Η λύση ακούγεται απλή, αλλά απαιτούσε το θάρρος να σπάσουμε τη σύμβαση — να εγκαταλείψουμε το Ελαστικό Φύλλο και να στραφούμε στην κυκλική περικοπή ROI: με το κέντρο της ίριδας ως αρχή, περικόψτε μια τετράγωνη περιοχή (2,5 φορές την ακτίνα) για να διατηρήσετε τη φυσική χωρική συμμετρία της ίριδας, στη συνέχεια αλλάξτε απευθείας το μέγεθός της σε 224x224 και τροφοδοτήστε την στο ViT. Με αυτόν τον τρόπο, κάθε περιοχή 16x16 μπορεί να αντιληφθεί την αυθεντική, ανεπηρέαστη υφή της ίριδας.

III. Βασικές Μετρήσεις: EER = 0,29%, ROC AUC = 0,9999

Η αλλαγή αυτού του μοναδικού βήματος προεπεξεργασίας έφερε μια τεράστια διαφορά:
Λύση EER Σχόλια
Γύρος 1: ViT + Ελαστικό Φύλλο 4,65% Παραδοσιακή ροή εργασίας
Γύρος 2: CNN + Ελαστικό Φύλλο 2,80% Αντικατάσταση backbone με περιορισμένη βελτίωση
Γύρος 3: ViT + Περικοπή ROI ~0,12%* Κρίσιμη ανακάλυψη
Τελική Έκδοση: ViT-S/16 + ROI + Κανονικοποίηση 0,29% Λύση ποιότητας παραγωγής

*Τα αποτελέσματα του Γύρου 3 δεν υπόκεινται σε αυστηρή στατιστική επαλήθευση και περιέχουν αισιόδοξη μεροληψία.

      Το τελικό σύστημα που κυκλοφόρησε υιοθετεί το ViT-S/16 (22,1 εκατομμύρια παράμετροι) + απώλεια γωνιακού περιθωρίου ArcFace, εκπαιδευμένο σε συγχώνευση 8 δημόσιων συνόλων δεδομένων (σύνολο 4.480 ταυτότητες / 67.704 εικόνες). Μετά από αυστηρή στατιστική επαλήθευση, τα αποτελέσματα είναι τα εξής:

      EER = 0,29% (Ποσοστό Ίσου Σφάλματος)

      ● Διάστημα Εμπιστοσύνης 95%: [0,21%, 0,40%] (200 γύροι επαναδειγματοληψίας Bootstrap)

      ● ROC AUC = 0,9999 (σχεδόν τέλειο σκορ)

      ● Μέση ομοιότητα γνήσιου ζεύγους: 0,8742 (υψηλή συνέπεια για το ίδιο άτομο)

      ● Μέση ομοιότητα ζεύγους παραχαράκτη: 0,0450 (πλήρης διαχωρισμός χαρακτηριστικών για διαφορετικά άτομα)

      ● Στο FRR=1%, FAR = 0,00% (μηδενική ψευδής αναγνώριση σε σημεία λειτουργίας υψηλής ασφάλειας)

τα τελευταία νέα της εταιρείας για Η πρωτοποριακή ανακάλυψη της Homsh: ViT+ArcFace επιτυγχάνει 0,29% EER στην αναγνώριση ίριδας  1
▲ Καμπύλη ROC (AUC=0,9999) και Κατανομή Βαθμολογίας Γνήσιου/Παραχαράκτη — Δύο Κορυφές Πλήρως Διαχωρισμένες

IV. Δεδομένα Εκπαίδευσης: Όχι Μόνο Μεγάλα, Αλλά και Ποικίλα

Αυτή η μελέτη συγχώνευσε 8 δημόσια σύνολα δεδομένων, συμπεριλαμβανομένων των δύο πιο δύσκολων σεναρίων στον κλάδο:

Δεδομένα Διδύμων (CASIA-Iris-Twins)

      Δεδομένα ίριδας από 200 ζεύγη διδύμων — ακόμη και με σχεδόν πανομοιότυπα γονίδια, οι υφές της ίριδας είναι εντελώς διαφορετικές. Αυτό είναι το "τελικό τεστ" για την επαλήθευση της διακριτικής δύναμης του αλγορίθμου.

Σενάρια Ορατού Φωτός Χωρίς Περιορισμούς (UBIRIS.v2)

      518 ταυτότητες με πάνω από 11.000 εικόνες, ληφθείσες υπό φυσικό φωτισμό με θόλωση κίνησης, παραμόρφωση εκτός εστίασης και διακυμάνσεις φωτισμού — αυτό είναι το σύνολο δεδομένων που είναι πιο κοντά στα σενάρια πραγματικής ανάπτυξης.
      Η εκπαίδευση ολοκληρώθηκε σε ένα Apple Silicon M2 Ultra (Mac Studio) σε περίπου 12,3 ώρες (90 εποχές εκπαίδευσης), με μέγιστη καθυστέρηση εξαγωγής συμπερασμάτων μόλις ~35ms (συμπεριλαμβανομένης της περικοπής ROI και της εξαγωγής χαρακτηριστικών).

V. Οριζόντια Σύγκριση με Κορυφαίες Εργασίες του Κλάδου

Μέθοδος Backbone Προεπεξεργασία EER
Daugman IrisCode Gabor Ελαστικό Φύλλο ~0,10% (Ελεγχόμενο Περιβάλλον)
UniqueNet (2016) Siamese CNN Ελαστικό Φύλλο 0,18%
IrisFormer (2023) ViT-B/16 Ελαστικό Φύλλο 0,22%
PolyIRIS (2021) Multi-scale CNN Ελαστικό Φύλλο (Ενιαίο Σύνολο Δεδομένων)
Homsh ViT+ArcFace (Αυτή η Έκδοση) ViT-S/16 Περικοπή ROI 0,29% (8 Σύνολα Δεδομένων)

τα τελευταία νέα της εταιρείας για Η πρωτοποριακή ανακάλυψη της Homsh: ViT+ArcFace επιτυγχάνει 0,29% EER στην αναγνώριση ίριδας  2
▲ Από 4,65% σε 0,29% EER: Η Διαδρομή Τεχνολογικής Εξέλιξης Τεσσάρων Γύρων Επανάληψης

VI. Επόμενα Βήματα

1.Ανεξάρτητη Αξιολόγηση Δια-Συνόλου Δεδομένων
      Τυφλή δοκιμή στο σύνολο δεδομένων IIT Delhi που δεν συμμετείχε στην εκπαίδευση για την επαλήθευση της ικανότητας γενίκευσης στον πραγματικό κόσμο.
2.Ενσωμάτωση Ανίχνευσης Ζωντάνιας
      Συνδυασμός απόκρισης φλας πολλαπλών καρέ ή ανάλυσης υφής για προστασία από επιθέσεις αναπαραγωγής φωτογραφιών και δημιουργία ενός πλήρους συστήματος κατά της πλαστογράφησης.
3.Αναγνώριση Ίριδας Μεσαίας και Μεγάλης Εμβέλειας
      Εισαγωγή δεδομένων μεσαίας εμβέλειας (3μ) για επέκταση σε σενάρια με μεγαλύτερες αποστάσεις λήψης — ο επόμενος μπλε ωκεανός για εμπορική υλοποίηση.
4.Ελαφρύς Σχεδιασμός και Ανάπτυξη στην Άκρη
      Απόσταξη του μοντέλου ViT-S/16 σε <5 εκατομμύρια παραμέτρους για προσαρμογή σε συσκευές άκρης με περιορισμένους πόρους (NPU/FPGA).

Συμπέρασμα: Μια Τριαντάχρονη Σύμβαση Αξίζει Επανεξέτασης

      Το Ελαστικό Φύλλο του Daugman ήταν η βέλτιστη λύση της εποχής του. Αλλά η ουσία της τεχνολογίας είναι αυτή: όταν εμφανίζονται καλύτερα εργαλεία, το παλιό παράδειγμα πρέπει να παραχωρήσει τη θέση του.
      Το Vision Transformer έχει αλλάξει την υποκείμενη λογική της αναγνώρισης εικόνων. Μέσω τεσσάρων γύρων πειραμάτων και τεσσάρων μηνών εξερεύνησης, βρήκαμε τον σωστό τρόπο για να αξιοποιήσει πλήρως το ViT τις δυνατότητές του στην αναγνώριση ίριδας — όχι για να προσαρμόσουμε το ViT στην παλιά ροή εργασίας, αλλά για να σχεδιάσουμε ένα νέο παράδειγμα προεπεξεργασίας προσαρμοσμένο για το ViT.
      Ένα EER 0,29% είναι απλώς ένας αριθμός, αλλά και μια δήλωση:
      Η αναγνώριση ίριδας έχει εισέλθει στην εποχή του Transformer, και η Homsh βρίσκεται στην αρχή.

Σχετικά με την Homsh

      Η WuHan Homsh Technology Co., Ltd. (HOMSH), που ιδρύθηκε το 2011, είναι μία από τις λίγες επιχειρήσεις υψηλής τεχνολογίας στον κόσμο που κατέχει ανεξάρτητα δικαιώματα πνευματικής ιδιοκτησίας για βασικούς αλγορίθμους και τσιπ αναγνώρισης ίριδας. Ο βασικός αλγόριθμος Phaselirs™ και τα έξυπνα τσιπ της σειράς Qianxin FPGA/ASIC για αναγνώριση ίριδας έχουν χρησιμοποιηθεί ευρέως σε χρηματοοικονομικές συλλογές, εκτελωνισμούς, έκδοση κυβερνητικών πιστοποιητικών, στρατιωτική ασφάλεια και άλλους τομείς.