רשתות עצביות לבובות: מבוא מהיר לתחום מרתק זה

האם אי פעם תהיתם מהן כל הרשתות העצביות האלה שכולם מדברים עליהן, ופחדתם מכדי לשאול? ובכן, אל תפחדו יותר! בסוף ההודעה הזו תוכלו להיכנס לכל כנס ולסנוור את שולחן ארוחת הצהריים עם מילות המפתח שנרכשו לאחרונה!

אם פתחתם את הדפדפן בשנתיים האחרונות, ודאי ראיתם את הביטוי "רשתות עצביות" כמה (מאה) פעמים.

בקריאה קצרה זו, אתן לך קצת הקשר בתחום ובדבר עצמו. לא תהפוך למומחה העולמי בתחום בחמש הדקות הקרובות, אבל תעבור את שלב ההעלאה הלא טריוויאלי. תוכלו ללמוד גם כמה מילות מפתח כדי להרשים את המשפחה בשולחן ארוחת הערב, במיוחד אם תעקבו אחר רשימת הקריאה בסוף.

מהי למידת מכונה?

כדי להבין רשתות עצביות, ראשית עלינו להבין למידת מכונה. וכדי להבין למידת מכונה, בואו נדבר קודם על למידה אנושית, או על "תכנות קלאסי".

בתכנות קלאסי אני, המפתח, צריך להבין את ההיבטים של הבעיה שאני מנסה לפתור, ולדעת בדיוק מה כל הכללים כדי להגיע לפיתרון.

לדוגמה, נניח שאני רוצה שהתוכנית שלי תדע מה ההבדל בין ריבוע למעגל. ואז אחת הדרכים להתמודד עם זה היא לכתוב תוכנית שתוכל לזהות פינות ואז להחיל אותה כדי לספור את הפינות. אם התוכנית שלי רואה 4 פינות, אז הצורה הזו היא ריבוע, ואם היא לא רואה פינות, אז הצורה הזו היא עיגול.

ולמידת מכונה? באופן כללי מאוד, Machine Learning = למידה מדוגמאות.

בלימוד מכונה, כאשר אנו מתמודדים עם אותה בעיה בדיוק של הפרדת מעגלים וריבועים, היינו מעצבים מערכת למידה שתיקח כקלט דוגמאות רבות לצורות ולמעמד שלהם (ריבוע או מעגל). נקווה שהמכונה תלמד בעצמה את המאפיינים שמבדילים אותם.

ואז, ידידי, לאחר שהמכונה למדה את כל המאפיינים הללו, אוכל לתת לה תמונה חדשה של עיגול או ריבוע, כזו שלא ראתה קודם לכן , ואני מקווה שהיא תסווג אותה נכון.

מה זה נוירון?

נוירון, בהקשר של רשתות עצביות, הוא שם מהודר שאנשים חכמים-חושים משתמשים בהם כשהם מפוארים מכדי לומר פונקציה . פונקציה , בהקשר של מתמטיקה ומדעי מחשב, הוא שם מפואר משהו שלוקח כמה קלט, חל איזשהו היגיון, ומוציא את התוצאה.

יותר מכך, ניתן לראות בנוירון יחידת למידה אחת .

לכן עלינו להבין מהי יחידת למידה בהקשר של למידת מכונה. אז נבין גם את אבן הבניין הבסיסית ביותר של רשת עצבית, שהיא הנוירון.

לשם המחשה, נניח שאני מנסה להבין את הקשר בין מספר המילים בפוסט בבלוג, לבין מספר המילים שאנשים קוראים בפועל מאותו פוסט בבלוג. זכרו - אנחנו בתחום Machine Learning, שם אנו לומדים מדוגמאות.

אז אני אוסף דוגמאות רבות לספירת מילים בפוסטים בבלוג, המסומנים על ידי x , וכמה מילים אנשים באמת קוראים בפוסטים האלה, y , ואני מתאר לעצמי שיש קשר כלשהו ביניהם, המסומן על ידי f .

עם זאת, הטריק הוא שאני פשוט צריך לומר למכונה (התוכנית) סוג של מערכת היחסים שאני מצפה לראות (למשל קו ישר), והמכונה תבין את הקו בפועל שהיא צריכה למתוח.

מה הרווחתי כאן?

בפעם הבאה אני רוצה לכתוב פוסט בבלוג של x מילים זה, המכונה יכולה להחיל את היחסים F זה נמצא, ותגיד לי כמה מילים אני יכול לצפות שאנשים באמת לקרוא, y .

אז רשת עצבית היא ...

ובכן, אם נוירון הוא פונקציה, אז רשת עצבית היא רשת של פונקציות! כלומר יש לנו הרבה (הרבה רבות) פונקציות כאלה, יחידות למידה כאלה , וכל הכניסות והתפוקות שלהן שלובות זו בזו והן מזינות זו את זו.

כמעצב רשת זו, מתפקידי לענות על כמה שאלות:

  • כיצד ניתן לעצב את התשומות ו פלט ? (לדוגמא, אם הקלט הוא טקסט כלשהו, ​​האם אוכל לדגם אותו באותיות? מספרים? וקטורים? ...).
  • מהן הפונקציות בכל נוירון? (האם הם לינאריים? אקספוננציאליים? ...)
  • מהי הארכיטקטורה של הרשת? (כלומר איזו פלט של הפונקציה היא איזו קלט של הפונקציה?)
  • מהן מילות הבאזזאני יכול להשתמש בהם כדי לתאר את הרשת שלי?

לאחר שעניתי על השאלות הללו, אוכל "להראות" לרשת דוגמאות רבות (רבות רבות) לתשומות ופלטים נכונים, בתקווה שכשאני "אציג" לה קלט לדוגמא חדש שמעולם לא ראתה, היא תדע לתת את התפוקה הנכונה.

אופן הפעולה של תהליך למידה זה הוא מעבר לתחום של פוסט זה, אך כדי ללמוד עוד תוכלו לצפות בכך. אתה יכול גם ללכת למגרש המשחקים העצבי של רשת עצבים מגניבה בטירוף כדי להבין טוב יותר מה זה אומר.

רשתות עצביות - הסיפור הבלתי נגמר

מכיוון שתחום זה ממש מתפוצץ, כמות התוכן החדש (והאיכותי!) שיוצא בכל דקה היא בלתי אפשרית עבור כל בן אנוש לעקוב אחריו. (OMG אתה חושב שיגיע זמן שבני אדם יוכלו לבנות AI שיוכל לעקוב אחר ההתקדמות האנושית בתחום ה- AI ??)

כשנכנסים לתחום זה, הדבר הראשון שצריך לדעת הוא שאף אחד לא יודע הכל. אז תרגישו בנוח איפה שאתם, ופשוט תמשיכו להיות סקרנים :)

לכן, אני רוצה שהמילים האחרונות שלי בפוסט זה יהיו התייחסות לכמה מהמשאבים האישיים האהובים עלי ללמוד מהם:

  • גל יונה - אחד הבלוגרים האהובים עליי בתחום. הפוסטים שלה נעים בין הסברים טכניים קשים לביקורות חצי-פילוסופיות.
  • סיראג 'רבאל - יוטיובר עם אוסף ענק של סרטונים, החל מהסברים תיאורטיים וכלה בהדרכות ידניות, והכל גם סופר כיפי!
  • כריסטופר אולה - חוקר נלהב ותובנה, מנהל בלוג מזמין ויזואלית, עם פוסטים ממושגים בסיסיים ועד צלילות עמוקות.
  • לכיוון מדע הנתונים הוא הפרסום הגדול ביותר בינוני הספציפי לתחום, ומה שאני אוהב בו הוא שהעורכים הם אוצרים מצוינים. בכל פעם שיש לך כמה דקות / שעות פנויות, פשוט היכנס לדף הבית שלהם והתחל לחקור הכל , מכלים מעשיים וכלה בתוכן אלגוריתמי עמוק.