Dalmatiner
/

cv_animals

Image Classification

transfer-learning

vision-transformer

Generated from Trainer

Eval Results (legacy)

Model card Files Files and versions

Metrics Training metrics Community

Dalmatiner commited on Jun 1, 2025

Commit

44877b1

·

verified ·

1 Parent(s): 82f1846

Update README.md

Files changed (1) hide show

README.md +42 -7

README.md CHANGED Viewed

@@ -39,22 +39,57 @@ should probably proofread and complete it, then remove this comment. -->
 # cv_animals
-This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on the animals dataset.
-It achieves the following results on the evaluation set:
-- Loss: 0.0876
-- Accuracy: 0.9833
 ## Model description
-More information needed
 ## Intended uses & limitations
-More information needed
 ## Training and evaluation data
-More information needed
 ## Training procedure

 # cv_animals
 ## Model description
+Dieses Modell ist ein feingetuntes Vision Transformer (ViT) Modell, das auf dem vortrainierten [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) basiert. Es wurde speziell für die Klassifikation von Bildern in 90 verschiedene Tierklassen trainiert. Die zugrunde liegenden Daten stammen aus dem öffentlich verfügbaren Animal Image Dataset, das Bilder aus Google aggregiert.
+Das Modell eignet sich für Anwendungen, bei denen Tiere auf Fotos automatisch erkannt und klassifiziert werden sollen. Typische Einsatzgebiete sind beispielsweise:
+- automatisierte Artenbestimmung
+- bildgestützte Tierdatenerfassung in Forschung und Lehre
+- edukative oder interaktive Anwendungen (z. B. in Museen oder Apps).
+Erzielte Resultate:
+- Loss: 0.0876
+- Accuracy: 0.9833
 ## Intended uses & limitations
+### Vorgesehene Verwendungen
+Dieses Modell wurde für die Bildklassifikation von Tieren in 90 Kategorien entwickelt. Es eignet sich insbesondere für:
+- Bildbasierte Tiererkennung in Anwendungen wie Lernplattformen, mobilen Apps, oder interaktiven Tools
+- Unterstützung bei biologischer Arterkennung (z. B. für Bildungsprojekte oder Citizen Science)
+- Vergleich von Transfer-Learning-Modellen mit Zero-Shot-Modellen (z. B. CLIP)
+### Einschränkungen
+- Die Vorhersagen sind stark abhängig von Bildqualität und Perspektive
+- Das Modell wurde nur mit Bildern aus dem Kaggle-Datensatz trainiert – es ist nicht garantiert, dass es bei anderen Tierarten oder in freier Wildbahn korrekt klassifiziert
+- Mehrdeutige oder unklare Bilder (z. B. mit mehreren Tieren, Zeichnungen, Verdeckungen) können zu falschen Vorhersagen führen
 ## Training and evaluation data
+Datensatz: Animal Image Dataset - 90 different animals
+Anzahl Bilder: 5.400
+Klassen: 90 Tierarten (z. B. Hund, Katze, Elefant, Biene, Löwe etc.)
+Aufteilung:
+- 80 % Training (4.320 Bilder)
+- 10 % Validierung (540 Bilder)
+- 10 % Test (540 Bilder)
+### Augmentierungen
+Zur Verbesserung der Generalisierbarkeit wurden folgende Transformationen auf die Trainingsbilder angewendet:
+- RandomHorizontalFlip() – zufälliges horizontales Spiegeln
+- RandomRotation(25) – zufällige Drehung um ±25°
+- ColorJitter() – zufällige Helligkeits-, Kontrast-, Sättigungs- und Farbtonänderungen
 ## Training procedure