جعبه ابزار تشخیص شی/چهره نسخه 0.28

این جعبه ابزار، ابزارهایی را برای تشخیص اشیا/چهرهها با استفاده از الگوهای باینری محلی (و برخی از انواع آن) و ویژگیهای Haar فراهم میکند.
تشخیص شی/چهره با ارزیابی مدلهای آموزشدیده روی پنجرههای چند اسکن با مدلهای تقویتشده (مانند Adaboosting، FastAdaboosting و Gentleboosting) یا با مدلهای SVM خطی انجام میشود.
هدف اصلی FDT ارائه ابزارهای ساده اما کارآمد است که عمدتاً به زبان C نوشته شدهاند و دارای رابط MATLAB هستند و به راحتی قابل تغییرند.
قبل از نصب، مطمئن شوید که یک کامپایلر C روی سیستم خود دارید!!!!!
برای سیستمهای ویندوز، کامپایلرهای توصیه شده MSVC/MSVC express (رایگان)/کامپایلر اینتل هستند.
برای سیستمهای لینوکس، کامپایلرهای توصیه شده GCC (رایگان)/کامپایلر اینتل هستند.
لطفاً مطمئن شوید که کامپایلر خود را قبل از نصب FDT تنظیم کردهاید.
لطفاً فایلهای MEX را با استفاده از BLAS/LAPACK با Intel MKL پیوند دهید. برخی از crashها با کتابخانه BLAS/LAPACK داخلی MATLAB مشاهده شده است.
لطفاً فایل “readme.txt” را برای جزئیات کامل و منابع باز کنید.
توضیحات جامع و جزئیات بیشتر
این جعبه ابزار امکانات مختلفی را برای تشخیص اشیا و چهرهها در تصاویر فراهم میکند. در ادامه به توضیح بیشتر اجزای اصلی آن میپردازیم:
- الگوهای باینری محلی (LBP) و انواع آن:
الگوهای باینری محلی (Local Binary Patterns) روشی قدرتمند برای توصیف بافت تصویر هستند. این الگوها با مقایسه هر پیکسل با همسایگان آن، یک کد باینری ایجاد میکنند که نشان دهنده الگوی بافت در آن نقطه است. LBP به دلیل سادگی محاسباتی و مقاومت در برابر تغییرات نور، روشی محبوب در بینایی ماشین است.
انواع مختلفی از LBP وجود دارند که برای بهبود عملکرد در شرایط خاص طراحی شدهاند. به عنوان مثال، LBP دایرهای (Circular LBP) برای توصیف بهتر بافت در اطراف پیکسلها استفاده میشود، در حالی که LBP مقاوم در برابر چرخش (Rotation-invariant LBP) به تغییرات چرخش تصویر حساس نیست.
- ویژگیهای Haar:
ویژگیهای Haar نیز برای تشخیص شیء، به ویژه چهره، بسیار مؤثر هستند. این ویژگیها الگوهای تغییرات شدت نور در تصویر را شناسایی میکنند. ویژگیهای Haar معمولاً به صورت مستطیلهایی با اندازههای مختلف تعریف میشوند که در تصویر حرکت میکنند و میزان تغییرات شدت نور در داخل و خارج مستطیل را محاسبه میکنند.
ویژگیهای Haar به دلیل سرعت محاسبه بالا، برای تشخیص شیء در زمان واقعی مناسب هستند.
- پنجرههای چند اسکن:
روش چند اسکن (Multi-scale sliding window) یک روش رایج برای تشخیص شیء در تصاویر است. در این روش، یک پنجره با اندازههای مختلف روی تصویر حرکت میکند و در هر موقعیت، مدل تشخیص، شیء/چهره را بررسی میکند. این روش به این دلیل چند اسکن نامیده میشود که پنجره با اندازههای مختلف، تصویر را اسکن میکند.
- مدلهای تقویتشده (Boosting):
Adaboosting، FastAdaboosting و Gentleboosting الگوریتمهای یادگیری ماشین هستند که با ترکیب چندین مدل ضعیف (Weak classifiers)، یک مدل قویتر (Strong classifier) ایجاد میکنند. این مدلها برای تشخیص شیء/چهره بسیار مناسب هستند، زیرا میتوانند با ترکیب مدلهای ضعیف مختلف، به دقت بالایی در تشخیص دست یابند.
Adaboosting یکی از اولین و معروفترین الگوریتمهای boosting است. FastAdaboosting نسخه سریعتر Adaboosting است که برای بهبود سرعت آموزش و تشخیص طراحی شده است. Gentleboosting نیز نوع دیگری از boosting است که عملکرد بهتری در برخی از مسائل دارد.
- ماشین بردار پشتیبان (SVM):
ماشین بردار پشتیبان (Support Vector Machine) یک الگوریتم یادگیری ماشین دیگر است که میتواند برای دستهبندی و تشخیص اشیا استفاده شود. SVM با یافتن یک ابرصفحه (Hyperplane) که دادهها را به بهترین شکل از هم جدا میکند، عمل میکند. SVM به دلیل توانایی در کار با دادههای با ابعاد بالا و جلوگیری از بیشبرازش (Overfitting)، روشی محبوب در بینایی ماشین است.
- کامپایلر C:
از آنجا که بخش اصلی کد به زبان C نوشته شده، وجود یک کامپایلر C برای کامپایل و اجرای کدها ضروری است. کامپایلر C کد زبان C را به کد ماشین تبدیل میکند که توسط کامپیوتر قابل اجرا است.
- MSVC/MSVC Express/Intel Compiler:
اینها کامپایلرهای C/C++ محبوب برای ویندوز هستند. MSVC Express نسخه رایگان کامپایلر مایکروسافت است که برای پروژههای کوچک و متوسط مناسب است. کامپایلر اینتل نیز یک کامپایلر قدرتمند است که برای بهبود عملکرد کدها بهینهسازی شده است.
- GCC/Intel Compiler:
اینها کامپایلرهای C/C++ محبوب برای لینوکس هستند. GCC کامپایلر پیش فرض لینوکس است که به صورت رایگان در دسترس است. کامپایلر اینتل نیز برای لینوکس موجود است و میتواند عملکرد کدها را بهبود بخشد.
- تنظیم کامپایلر:
منظور از تنظیم کامپایلر، اطمینان از نصب صحیح آن و پیکربندی MATLAB برای استفاده از آن است. برای این کار باید مسیر کامپایلر را در MATLAB مشخص کنید و تنظیمات مربوط به آن را انجام دهید.
- BLAS/LAPACK و Intel MKL:
این کتابخانهها برای محاسبات ریاضی سنگین مانند ضرب ماتریسها و حل معادلات خطی استفاده میشوند. Intel MKL یک کتابخانه بهینهشده از اینتل است که میتواند عملکرد این محاسبات را بهبود بخشد. استفاده از MKL به جای کتابخانه داخلی MATLAB توصیه شده زیرا باگهایی در کتابخانه داخلی MATLAB دیده شده است.
- فایل readme.txt:
این فایل حاوی اطلاعات مهمی در مورد نحوه نصب، استفاده و پیکربندی جعبه ابزار، جزئیات بیشتر در مورد الگوریتمها، مراجع علمی و … است و مطالعه آن اکیدا توصیه میشود.
این توضیحات جامع و دقیق به شما کمک میکند تا به طور کامل با جعبه ابزار تشخیص شی/چهره و نحوه استفاده از آن آشنا شوید. در صورت وجود هرگونه سوال دیگر، میتوانید با ما در میان بگذارید.
