משפט דייוויס-קהאן
באלגברה ליניארית משפט דייוויס-קהאן (Davis-Kahan Theorem) על שם צ'נדלר דייוויס (אנ') וויליאם קהאן (אנ') עוסק ביציבות של וקטורים עצמיים של מטריצה הרמיטית כאשר יש הפרעה קטנה במטריצה. המשפט חוסם את השינוי במרחבים העצמיים של המטריצה המקורית לזו עם ההפרעה.
באופן לא פורמלי, בהינתן מטריצה הרמיטית ומטריצה הרמיטית נוספת המייצגת הפרעה על , אם ההפרעה היא קטנה וגם הערכים העצמיים של רחוקים מספיק משל , אז ההבדל בין המרחבים העצמיים (ובפרט הווקטורים העצמיים) של ושל הוא גם קטן.
רקע מתמטי
זווית בין מרחבים וקטורים (אנ')
יהי מרחב הילברט ותתי מרחבים וקטורים שלו מאותו מימד . יהיו מטריצות אוניטריות שעמודותיהן בסיס אורתונורמלי למרחבים בהתאמה (ניתן לחשב את המטריצות באמצעות תהליך גרם-שמידט). יהיו הערכים הסינגולריים של המטריצה . הזווית ה- בין המרחבים תוגדר ובהתאם נגדיר מטריצה[1]
נגדיר את המטריצה בתור המטריצה האלכסונית שמתקבלת מהפעלת סינוס לכל איבר בנפרד במטריצה המוגדרת. מקרה פרטי חשוב הוא הזווית בין שני מרחבים ממימד 1 (שני ישרים). במקרה הזה קיימים שני וקטורים באורך יחידה (הנורמה שלהם שווה ) שפורשים כל אחד בנפרד את בהתאמה. מכאן, המטריצה הנ"ל הופכת לסקלר (מטריצה ) :
כאשר משתמשים במכפלה הסקלרית ובזווית בין וקטורים שנובעת ממנה. נשים לב לכך שיש חופש בחירה בכיוון הווקטורים . תחת אותו חופש, קיים עבורו . הערך הסינגולרי היחיד של מטריצה הוא הערך המוחלט שלה לכן במקרה הזה הגדרת הזווית בין המרחבים תהיה:
למרות העובדה שהזוויות בין מרחבים יכולות להיות רק בטווח (לעומת שני וקטורים שהזווית בניהם יכולה להיות ב, זהו הבדל אינהרנטי בין וקטורים בודדים לבין מרחבים וקטורים) הדיון הזה מראה שההגדרה של זווית בין מרחבים מתיישבת עם זו של זווית בין שני וקטורים.
נורמה נשמרת אוניטרית
ערך מורחב – נורמה של מטריצות
נורמה של מרחב מטריצות מסדר תיקרא נשמרת אוניטרית אם:
לכל מטריצה אוניטרית מסדר ו- אוניטרית מסדר . שתי דוגמאות נפוצות הן נורמת פרוביניוס ונורמת-2 (הנורמה האופרטורית של המטריצה מעל מרחב וקטורי עם הנורמה האוקלידית).
נורמה היא נשמרת אוניטרית אם ורק אם קיימת פונקציית כיול סימטרית (Symmetric Gauge Function) שמקיימת[2]:
כאשר הערכים הסינגולריים של .[3]
נורמה תיקרא תת-כפלית אם לכל שתי מטריצות מתקיים:
כל נורמה נשמרת אוניטרית היא תת-כפלית.[4] בנוסף, יהיו
ההטלות האורתוגונליות לתתי מרחבים
בהתאמה. ניתן להראות את השוויון:[5]
לכל נורמה נשמרת אוניטרית.
ניסוח פורמלי של המשפט
למשפט יש מספר ניסוחים פורמליים שונים, נציג ניסוח של משפט הסינוס () של דייוויס וקהאן הנובע מהמאמר שלהם.[6]
יהיו מטריצות הרמיטיות בגודל עם ערכים עצמיים של ו - ערכים עצמיים של . ממשפט הפירוק הספקטרלי, קיימות מטריצות שוקטורי העמודה שלה הם בסיס אורתונורמלי ו- עם וקטורי עמודה עבורן:
כאשר הן מטריצות אלכסוניות עם הערכים בהתאמה. יהי אינדקס , נגדיר כאשר מטריצה עם וקטורי השורה השמאליים של (היא מייצגת את הווקטורים שפורשים את כל המרחבים העצמיים עד זה שמתאים לערך העצמי במקום ה-) ו - עם האחרים (מייצגת את הווקטורים העצמיים שפורשים יחד את כל שאר המרחב הווקטורי). באופן דומה נגדיר . נגדיר :
כאשר בלוקים בגודל ו- בלוקים בגודל . נגדיר מטריצה:
נניח שקיים קטע ו- כך ש- לכל וגם לכל . אזי, עבור , אופרטור הזווית בין המרחב שנפרש על ידי העמודות של למרחב שנפרש על ידי עמודות , לכל נורמה נשמרת אוניטרית מתקיים:
תוצאות נלוות והכללות
במאמר המקורי של דייוויס וקהאן, הוצגו משפטים נוספים מעבר למשפט ה- הם הוכיחו משפטי . בפועל, משפט מהמאמר הוא הכי משומש מבין כולם.[6]
משפט וודין
משפט וודין (Wedin) מהווה הכללה למשפט דייוויס-קהאן עבור מטריצות שאינן בהכרח הרמיטיות ריבועיות.[7] יהיו מטריצות מרוכבות מסדר כללי . קיים פירוק לערכים סינגולריים:
כאשר המטריצה מסדר , המטריצה מסדר ו- מסדר . בנוסף, בדומה להגדרה במשפט דייוויס-קהאן נגדיר:
באמצעות פיצול בין העמודות הראשונות לשאר העמודות. פירוק דומה ניתן לעשות למטריצה . נגדיר:
נגדיר:
משפט וודין גורס כי אם הערכים הסינגולריים מקיימים וגם אז עבור:
בסימון המרחב הווקטורי שהוא תמונה של ההעתקה נקבל את אי השוויונות הבאים:
הרחבה של המשפט לסטטיסטיקאים
במשפט דייוויס קהאן, נדרשת אמירה על הספקטרום של שתי המטריצות - המקורית וזו אחרי ההפרעה. במאמר של יו טנגיאו וואנג ו-ריצ'רד סאמוורת'(אנ') הרחבה המאפשרת להשתמש בדרישות רק על הספקטרום של .[8]
יהיו מטריצות סימטריות מסדר עם ערכים עצמיים של ו - ערכים עצמיים של . נגדיר ונקבע . נניח ש- נגדיר . יהיו המרחב שנפרש על ידי הערכים העצמיים של ו- המרחב שנפרש על ידי הערכים העצמיים של . מתקיים:
כאשר נורמת פרובניוס ו- נורמת 2 - הנורמה האופרטורית האוקלידית.
מקרה פרטי של ההרחבה הזו כאשר בא לידי ביטוי במספר שימושים של משפט דייוויס-קהאן. נניח שמתקיים:
אזי, אם וקטור עצמי של המתאים לערך העצמי וגם וקטור עצמי של המתאים לערך העצמי , קיים כך שהזווית בין הווקטורים:
בנוסף לכך, הראו במאמר תוצאה בעלת אופי דומה:
אי-שוויון וייל
ערך מורחב – אי-שוויון וייל
בעוד משפט דייוויס-קהאן עוסק בקשר בין וקטורים עצמיים של מטריצה הרמיטית תחת הפרעה, אי שוויון וויל (Weyl) מספק חסם על שינוי הערכים העצמיים. בדומה לניסוח תנאי משפט דייוויס-קהאן, יהיו מטריצות הרמיטיות ממימד n. נסמן בתור הערך העצמי ה-i של (כאשר הערכים העצמיים בסדר יורד, ניתן לעשות זאת כי המטריצה הרמיטית). אי שוויון וויל אומר כי:
רעיונות מרכזיים בהוכחה
נתבסס על ההוכחה של המשפט במאמר של דייוויס וקהאן.[6] תחילה, נשתמש בטענת עזר - תהי נורמה נשמרת אוניטרית ויהיו ויהיו שני אופרטורים שמקיימים וגם ויהי אופרטור אזי האופרטור:
מקיים .
הוכחת טענת העזר: מתת-כפליות של נורמה נשמרת אוניטרית, וגם ומאי-שוויון המשולש:
כנדרש.
כעת נכתוב בצורה יותר מפורשת את המטריצות:
מהכתיבה המפורשת של המטריצות ניתן להסיק . לכן:
כעת, מפני שנורמת האופרטור חסומה על ידי , מתת-כפליות . נקבל:
נוסיף לאופרטור כפולה של מטריצת היחידה (ניתן לעשות זאת מכיוון שזה לא משנה את המרחבים העצמיים) כך שנקבל . בצורה הזו מהנתון בתנאי המשפט על ההפרש בספקטרום, נוכל להשתמש בטענת העזר:
לבסוף, ניתן להראות שלאופרטור יש אותם ערכים סינגולריים כמו ל-, ומפני שנורמה נשמרת אוניטרית היא פונקציה של הערכים הסינגולריים של האופרטור, מתקיים:
היסטוריה
המשפט של דייוויס-קהאן נולד מתוך התפתחות תורת ההפרעות של מטריצות, תחום שקיבל תשומת לב רבה במאה ה-20. בעבודות מוקדמות, כמו הספר של טוסיו קאטו(אנ') - "תורת ההפרעות לאופרטורים ליניאריים" משנת 1966, נדרשה רמת דיוק גבוהה יותר בניתוח מטריצות, דבר שהשפיע על התחום המתמטי והרחיב את הידע בהקשר של ניתוח ספקטרלי.[9] במקביל, אנליסטים נומריים תרמו להבנת יציבות ערכים עצמיים ותתי מרחבים עצמיים של מטריצות מופרעות, ובמיוחד דרך עבודותיהם של ג'יימס הארדי וילקינסון(אנ') ואחרים.
בשנת 1970 יצא משפט דייוויס-קהאן שהפך לכלי מרכזי בהבנת רגישותם של תתי מרחבים ספקטרליים להפרעות, בכך שהציע גבול ברור על הזווית בין מרחבים עצמיים של מטריצה ומטריצה מופרעת. תוצאה זו הייתה חשובה במיוחד לאנליסטים נומריים, והיא הובילה לפיתוחים נוספים בתחום. בשנת 1972, תוצאות אלו הורחבו על ידי וודין למטריצות לא הרמיטיות, מה שאִפשר את יישום התיאוריה גם במקרים של מטריצות מלבניות כלליות.[7] במאמר מ-2015 של יו טנגיאו וואנג וריצ'רד סאמוורת' הותאמה תוצאת דייוויס-קאהן להקשרים סטטיסטיים, עם תנאי הפרדה מקלים בין ערכים עצמיים של אוכלוסייה ומדגם, מה שהרחיב את השימוש בה ואפשר גישה ליישומים מעשיים.[8] בשנת 2018, שיפרו אלדרידג', בלקין ו-וואנג את חסמי ההפרעה הקלאסיים על ידי התחשבות ברעש אקראי. הם הציעו חסמים מדויקים יותר להפרעות בערכים עצמיים ובווקטורים עצמיים, והתוצאות עלו בביצועיהן על אלו של משפטים מסורתיים כמו משפט וייל ברבים מהמקרים המעשיים.[10] חשוב לציין שרשימת הפיתוחים הנ"ל אינה ממצה את מה שקיים בספרות המתמטית.
הקשר לתורת ההפרעות
משפט דייוויס-קהאן קשור ישירות לתורת ההפרעות, תחום במתמטיקה ובפיזיקה שמתמקד בניתוח השפעות של שינויים קטנים במערכות על הפתרונות שלהן. בתורת ההפרעות, נבחנים שינויים קטנים במטריצות, אופרטורים, או מערכות דינמיות, וכיצד שינויים אלו משפיעים על הערכים העצמיים, הווקטורים העצמיים או תוצאות אחרות.
המשפט והרחבותיו מהווה למעשה תוצאה בתורת ההפרעות עבור מטריצות, כאשר יש עניין באמידת השינוי שנגרם לווקטורים העצמיים בעקבות הוספת הפרעה קטנה. משפט דייוויס-קהאן מספק כלים פורמליים למדידת שינויים אלו.
דוגמה קלאסית לשימוש בתורת ההפרעות מופיעה בפיזיקה קוונטית, שם אופרטורים המייצגים גדלים פיזיקליים מתוארים כמטריצות הרמיטיות, והערכים העצמיים מייצגים תוצאות אפשריות של מדידות. הפרעות קטנות באופרטורים אלו, כגון שדה חיצוני, משפיעות על הערכים והווקטורים העצמיים של המערכת. תורת ההפרעות מאפשרת לחשב את השינויים האלו, ומשפט דייוויס-קהאן מספק חסמים לשינויים אלו עבור וקטורים עצמיים.
דוגמאות לשימושים
מודל Spiked Covariance
ערך מורחב – מודל Spiked Covariance
מודל זה עוסק באומדן וקטור עצמי מוביל של מטריצת שונות משותפת מדגמית. במצבים בהם הווקטור העצמי המוביל בולט בצורה משמעותית על פני וקטורים אחרים, באמצעות משפט דייוויס-קהאן ניתן להעריך את מידת הקרבה בין הווקטור העצמי האמיתי לבין זה שנאמד על בסיס דגימות אקראיות. באופן פורמלי, יהיו וקטורים אקראיים ב - . נניח שמטריצת השונות המשותפת, היא עבור ו - וקטור בגודל יחידה (). מההגדרה הנ"ל, הערך העצמי הגדול ביותר של מטריצה הוא עם וקטור עצמי מתאים . אנחנו מעוניינים להסיק מהו על סמך דגימות. תהי ויהי הווקטור העצמי (בגודל יחידה) המוביל של נשתמש בחישוב הבא:
כעת, מאי שוויון קושי שוורץ, לכן:
מפני שההפרש בין הערך העצמי המוביל לכל הבאים הוא , נשתמש ב (הרחבה לסטטיסטיקאים של) משפט דייוויס-קהאן ונקבל:
תחת הנחות נוספות ניתן לקבל חסם על והערכה על קצב הדעיכה של .[11]
מודל בלוקים סטוכסטי
ערך מורחב – מודל בלוקים סטוכסטי
נראה שימוש למקרה פרטי של מודל בלוקים סטוכסטי. יהי גרף שקבוצת הקודקודים בו מחולקת לשתי קהילות שבה כל זוג נקודות בתוך הקהילה מחוברות זו לזו בהסתברות וכל זוג נקודות בקהילות שונות מחוברות זו לזה בהסתברות . מטריצת השכנויות של הגרף מוגדרת באופן הסתברותי כך ש- מתפלג ברנולי בהסתברות אם באותה קהילה ומתפלג ברנולי בהסתברות אם הם בקהילות שונות. נשים לב לכך שהתוחלת של המטריצה היא:
משמע מטריצת בלוקים שכל אחד מארבעת הבלוקים מטריצה שמקבלת רק הערך או בהתאמה. אפשר להראות שהדרגה של היא , שהערך העצמי המוביל הוא והווקטור העצמי המתאים לו הוא:
הערך העצמי השני הוא והווקטור העצמי המתאים לו:
נרצה לנחש את הקהילות המקוריות באמצעות קירוב את הווקטור העצמי השני (אם אז בקהילה אחת ואם אז בקהילה השנייה). נשתמש במשפט הבא:
תהי מטריצה ממשית מסדר עם איברים שכל אחד משתנה מקרי בעל תוחלת ומתפלג תת-גאוסית עם נורמת תת-גאוסית . לכל קיים קבוע כך שאי השוויון הבא מתקיים:[12]
מכאן, מפני שהמטריצה נגדיר מטריצה חדשה מקיימת את תנאי המשפט, בהסתברות גבוהה מתקיים:
בנוסף, ההפרש בין הערך העצמי השני לערכים העצמיים הקרובים אליו (הראשון והשלישי) של הוא:
מכאן, בשימוש בהרחבה של משפט דייוויס-קהאן לסטטיסטיקאים, נקבל בהסתברות גבוהה שקיים עבורו הווקטור העצמי השני מקיים:
ניתן להראות שמספר האינדקסים בהם הסימן של שונה מזה של שואף ל- כאשר שואף לאינסוף. לכן, עבור מספיק גדול, בהסתברות גבוהה מספר טעויות הסיווג יהיה קטן.[11]
ראו גם
תורת ההפרעות
משפט הפירוק הספקטרלי
ספקטרום (מתמטיקה)
פירוק לערכים סינגולריים
אי-שוויון וייל
מודל בלוקים סטוכסטי
מודל spiked covariance
תורת ההפרעות (מכניקת הקוונטים)
הערות שוליים
- ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ בתהליכי בנייה "תבנית:Cite web"
- ^ בתהליכי בנייה "תבנית:Cite book"
- ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ 1 2 3 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ 1 2 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ 1 2 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ בתהליכי בנייה "תבנית:Cite book"
- ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
- ^ 1 2 בתהליכי בנייה "תבנית:Cite book"
- ^ בתהליכי בנייה "תבנית:Cite book"