摘要:
本研究採用 YOLOv5 模型進行鳥類物件偵測,數據來源選自 Pixabay,一個於 2010 年創立於德國並於 2018 年被 Canva 收購的素材分享平台,截至 2022 年底提供超過 270 萬張素材。本次研究從 Pixabay 平台挑選 20 張鳥類影像作為基礎數據集,透過 XnConvert 進行數據增強,針對每張影像進行倒置、降低曝光度、模糊化及傾斜等四種增強操作,最終生成 320 張影像數據。這些影像透過 labelImg 工具進行標註後,依 8:1:1 的比例分為訓練集(256 張)、驗證集(32 張)與測試集(32 張)。研究使用增強後的數據進行 YOLOv5 模型訓練,確保模型能適應不同光線、角度及模糊影像,並提高其在實際應用中的穩健性與準確性。本研究成果展現了以 YOLOv5 進行鳥類物件偵測的完整流程,並透過高效的數據處理與模型訓練提升其學習能力與泛化性能,為動物影像分析及自然物件辨識的相關應用提供了技術支持。
結論:
本研究利用 YOLOv5 模型針對鳥類影像進行物件偵測,經過精心的數據增強與標註,模型在測試階段展現了卓越的性能。在未訓練過的鳥類影像中,預測置信度均超過 80%,且模型的精確率、回召率和 F1 分數均達到極高水準,顯示出模型具備優異的泛化能力與穩定性。
研究結果表明:
高性能表現:在不同置信度條件下,模型在準確率與回召率之間達到了良好的平衡,mAP@0.5 高達 0.995,表現極為出色。
數據標註一致性:標註框的分布與數據特徵顯示,數據集的標註質量為模型訓練提供了良好的基礎。
模型穩定性:無論在已訓練或未訓練的影像上,模型均能保持高置信度的準確預測,展現出強大的辨識能力。
然而,本研究仍存在一些限制,未來可以在以下方向進一步提升:
擴展數據集的多樣性,涵蓋更多稀有鳥類影像(包含不同動作下的鳥類影像)與不同場景,提升模型的適應性與泛化能力。
優化模型結構,採用更輕量化或是更新版本的架構,適用於實時應用與邊緣設備部署。
總體而言,本研究驗證了 YOLOv5 模型在鳥類物件偵測中的潛力,為未來動物影像分析與自然物件辨識應用提供了堅實的技術基礎。透過不斷完善數據處理與模型優化技術,這一成果將有助於推動生物學研究、自然保育及相關應用的發展。
完整研究內容
點擊以下按鈕查看完整的研究內容: