משפט דייוויס-קהאן

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

באלגברה ליניארית משפט דייוויס-קהאן (Davis-Kahan Theorem) על שם צ'נדלר דייוויס (אנ') וויליאם קהאן (אנ') עוסק ביציבות של וקטורים עצמיים של מטריצה הרמיטית כאשר יש הפרעה קטנה במטריצה. המשפט חוסם את השינוי במרחבים העצמיים של המטריצה המקורית לזו עם ההפרעה.

באופן לא פורמלי, בהינתן מטריצה הרמיטית A ומטריצה הרמיטית נוספת H המייצגת הפרעה על A, אם ההפרעה היא קטנה וגם הערכים העצמיים של A רחוקים מספיק משל A+H, אז ההבדל בין המרחבים העצמיים (ובפרט הווקטורים העצמיים) של A ושל A+H הוא גם קטן.

רקע מתמטי

זווית בין מרחבים וקטורים (אנ')

יהי מרחב הילברט ותתי מרחבים וקטורים שלו M,L מאותו מימד d. יהיו UM,UL מטריצות אוניטריות שעמודותיהן בסיס אורתונורמלי למרחבים M,L בהתאמה (ניתן לחשב את המטריצות באמצעות תהליך גרם-שמידט). יהיו σ1...σd הערכים הסינגולריים של המטריצה UM*UL. הזווית ה-i בין המרחבים תוגדר cos1(σi) ובהתאם נגדיר מטריצה[1]

Θ(M,L)=(cos1σ1000cos1σ2000cos1σd)

נגדיר את המטריצה sin(Θ(M,L)) בתור המטריצה האלכסונית שמתקבלת מהפעלת סינוס לכל איבר בנפרד במטריצה המוגדרת. מקרה פרטי חשוב הוא הזווית בין שני מרחבים ממימד 1 (שני ישרים). במקרה הזה קיימים שני וקטורים באורך יחידה (הנורמה שלהם שווה 1) שפורשים כל אחד בנפרד את M,L בהתאמה. מכאן, המטריצה הנ"ל הופכת לסקלר (מטריצה 1×1) :

UM*UL=uMuL=cos((uM,uL))

כאשר משתמשים במכפלה הסקלרית ובזווית בין וקטורים שנובעת ממנה. נשים לב לכך שיש חופש בחירה בכיוון הווקטורים ±uM,±uL. תחת אותו חופש, קיים ϵ{1,1} עבורו ϵuMuL0. הערך הסינגולרי היחיד של מטריצה 1×1 הוא הערך המוחלט שלה לכן במקרה הזה הגדרת הזווית בין המרחבים תהיה:

cos1(σ1)=cos1(ϵuMuL)=(ϵuM,uL)

למרות העובדה שהזוויות בין מרחבים יכולות להיות רק בטווח [0,π/2] (לעומת שני וקטורים שהזווית בניהם יכולה להיות ב[0,π], זהו הבדל אינהרנטי בין וקטורים בודדים לבין מרחבים וקטורים) הדיון הזה מראה שההגדרה של זווית בין מרחבים מתיישבת עם זו של זווית בין שני וקטורים.

נורמה נשמרת אוניטרית

ערך מורחב – נורמה של מטריצות

נורמה של מרחב מטריצות מסדר n×m תיקרא נשמרת אוניטרית אם:

UAV=A

לכל V מטריצה אוניטרית מסדר m×m ו-U אוניטרית מסדר n×n. שתי דוגמאות נפוצות הן נורמת פרוביניוס ונורמת-2 (הנורמה האופרטורית של המטריצה מעל מרחב וקטורי עם הנורמה האוקלידית).

נורמה היא נשמרת אוניטרית אם ורק אם קיימת f פונקציית כיול סימטרית (Symmetric Gauge Function) שמקיימת[2]:

A=f(σ1,...,σr)

כאשר σ1,...,σr הערכים הסינגולריים של A.[3]

נורמה תיקרא תת-כפלית אם לכל שתי מטריצות A,B מתקיים:

ABAB

כל נורמה נשמרת אוניטרית היא תת-כפלית.[4] בנוסף, יהיו

PM,PL

ההטלות האורתוגונליות לתתי מרחבים

M,L

בהתאמה. ניתן להראות את השוויון:[5]

sin(Θ(L,M))=(IPM)PL

לכל נורמה נשמרת אוניטרית.

ניסוח פורמלי של המשפט

למשפט יש מספר ניסוחים פורמליים שונים, נציג ניסוח של משפט הסינוס (sin(Θ)) של דייוויס וקהאן הנובע מהמאמר שלהם.[6]

יהיו A,A+H מטריצות הרמיטיות בגודל n×n עם λ1<λ2<...<λn ערכים עצמיים של A ו - μ1<μ2<...<μn ערכים עצמיים של A+H. ממשפט הפירוק הספקטרלי, קיימות מטריצות E שוקטורי העמודה שלה הם בסיס אורתונורמלי u1,...,un ו-F עם וקטורי עמודה v1,...,vn עבורן:

A=EΛE*,A+H=FMF*

כאשר Λ,M הן מטריצות אלכסוניות עם הערכים Λii=λi,Mii=μi בהתאמה. יהי אינדקס 1<d<n, נגדיר E=(E0,E1) כאשר E0 מטריצה עם d וקטורי השורה השמאליים של E (היא מייצגת את הווקטורים שפורשים את כל המרחבים העצמיים עד זה שמתאים לערך העצמי במקום ה-d) ו - E1 עם nd האחרים (מייצגת את הווקטורים העצמיים שפורשים יחד את כל שאר המרחב הווקטורי). באופן דומה נגדיר F=(F0,F1). נגדיר Λ0,Λ1,M0,M1:

Λ=(Λ000Λ1),M=(M000M1)

כאשר Λ0,M0 בלוקים בגודל d×d ו-Λ1,M1 בלוקים בגודל (nd)×(nd). נגדיר מטריצה:

R=HE0

נניח שקיים קטע [β,α] ו-δ>0 כך ש-λi[β,α] לכל i{1,...,d} וגם μi[βδ,αδ] לכל i{d+1,...,n}. אזי, עבור Θ, אופרטור הזווית בין המרחב שנפרש על ידי העמודות של E0 למרחב שנפרש על ידי עמודות F0, לכל נורמה נשמרת אוניטרית מתקיים:

δsin(Θ)R

תוצאות נלוות והכללות

במאמר המקורי של דייוויס וקהאן, הוצגו משפטים נוספים מעבר למשפט ה-sin(Θ) הם הוכיחו משפטי sin(2Θ),tan(Θ),tan(2Θ). בפועל, משפט sin(Θ) מהמאמר הוא הכי משומש מבין כולם.[6]

משפט וודין

משפט וודין (Wedin) מהווה הכללה למשפט דייוויס-קהאן עבור מטריצות שאינן בהכרח הרמיטיות ריבועיות.[7] יהיו A,A+H מטריצות מרוכבות מסדר כללי m×n. קיים פירוק לערכים סינגולריים:

A=UΣV*=U0Σ0V0*+U1Σ1V1*

כאשר המטריצה Σ מסדר p×p, המטריצה U מסדר m×p ו-V מסדר n×p. בנוסף, בדומה להגדרה במשפט דייוויס-קהאן נגדיר:

V=(V0,V1),U=(U0,U1),Σ=(Σ000Σ1)

באמצעות פיצול בין d העמודות הראשונות לשאר העמודות. פירוק דומה ניתן לעשות למטריצה B=A+H. נגדיר:

Aj=Uj(A)Σj(A)Vj*(A),Bj=Uj(B)Σj(B)Vj*(B)

נגדיר:

R11=HV1(B),R21=H*U1(B)

משפט וודין גורס כי אם הערכים הסינגולריים מקיימים σmin(B1)α+δ וגם σmax(A0)α אז עבור:

ϵ=max(R11,R21)

בסימון Im(M) המרחב הווקטורי שהוא תמונה של ההעתקה M נקבל את אי השוויונות הבאים:

sin(Θ(Im(B1),Im(A1))ϵδ
sin(Θ(Im(B1*),Im(A1*))ϵδ

הרחבה של המשפט לסטטיסטיקאים

במשפט דייוויס קהאן, נדרשת אמירה על הספקטרום של שתי המטריצות - המקורית וזו אחרי ההפרעה. במאמר של יו טנגיאו וואנג ו-ריצ'רד סאמוורת'(אנ') הרחבה המאפשרת להשתמש בדרישות רק על הספקטרום של A.[8]

יהיו A,A+H מטריצות סימטריות מסדר n×n עם λ1<λ2<...<λn ערכים עצמיים של A ו - μ1<μ2<...<μn ערכים עצמיים של A+H. נגדיר λ0=,λn+1= ונקבע 1rsn. נניח ש-δ=min(λr1λr,λsλs+1)>0 נגדיר d=sr+1. יהיו M המרחב שנפרש על ידי ur,...,us הערכים העצמיים של A ו-L המרחב שנפרש על ידי vr,...,vs הערכים העצמיים של A+H. מתקיים:

sin(Θ(M,L))F2min(d1/2Hop,HF)δ

כאשר F נורמת פרובניוס ו-op נורמת 2 - הנורמה האופרטורית האוקלידית.

מקרה פרטי של ההרחבה הזו כאשר r=s=j בא לידי ביטוי במספר שימושים של משפט דייוויס-קהאן. נניח שמתקיים:

minij|λjλi|=δ>0

אזי, אם uj וקטור עצמי של A המתאים לערך העצמי λj וגם vj וקטור עצמי של A+H המתאים לערך העצמי μj, קיים ϵ{1,1} כך שהזווית בין הווקטורים:

0sin((ϵvj,uj))2min(HF,Hop)δ

בנוסף לכך, הראו במאמר תוצאה בעלת אופי דומה:

ujϵvj23/2min(HF,Hop)δ

אי-שוויון וייל

ערך מורחב – אי-שוויון וייל

בעוד משפט דייוויס-קהאן עוסק בקשר בין וקטורים עצמיים של מטריצה הרמיטית תחת הפרעה, אי שוויון וויל (Weyl) מספק חסם על שינוי הערכים העצמיים. בדומה לניסוח תנאי משפט דייוויס-קהאן, יהיו A,A+H מטריצות הרמיטיות ממימד n. נסמן λi(A) בתור הערך העצמי ה-i של A (כאשר הערכים העצמיים בסדר יורד, ניתן לעשות זאת כי המטריצה הרמיטית). אי שוויון וויל אומר כי:

λi+j1(A+H)λi(A)+λj(H)λi+jn(A+H)

רעיונות מרכזיים בהוכחה

נתבסס על ההוכחה של המשפט במאמר של דייוויס וקהאן.[6] תחילה, נשתמש בטענת עזר - תהי נורמה נשמרת אוניטרית ויהיו α0,δ>0 ויהיו שני אופרטורים שמקיימים A1(α+δ)1 וגם Bα ויהי אופרטור X אזי האופרטור:

C=AXXB

מקיים CδX.

הוכחת טענת העזר: מתת-כפליות של נורמה נשמרת אוניטרית, XBαX וגם AX(α+δ)X ומאי-שוויון המשולש:

CAXXBδX

כנדרש.

כעת נכתוב בצורה יותר מפורשת את המטריצות:

A+H=(E0E1)(Λ0+H0B*BΛ1+H1)(E0*E1*)=(F0F1)(M000M1)(F0*F1*)

מהכתיבה המפורשת של המטריצות ניתן להסיק AE0=E0Λ0. לכן:

R=HE0=(A+H)E0E0Λ0

כעת, מפני שנורמת האופרטור F1 חסומה על ידי 1, מתת-כפליות R=R*R*F1. נקבל:

R*F1=E0*F1M1Λ0E0*F1

נוסיף לאופרטור A כפולה של מטריצת היחידה (ניתן לעשות זאת מכיוון שזה לא משנה את המרחבים העצמיים) כך שנקבל 0α=β. בצורה הזו מהנתון בתנאי המשפט על ההפרש בספקטרום, נוכל להשתמש בטענת העזר:

R*F1δE0*F1

לבסוף, ניתן להראות שלאופרטור E0*F1 יש אותם ערכים סינגולריים כמו ל-sin(Θ), ומפני שנורמה נשמרת אוניטרית היא פונקציה של הערכים הסינגולריים של האופרטור, מתקיים:

RδE0*F1=δsin(Θ)

היסטוריה

המשפט של דייוויס-קהאן נולד מתוך התפתחות תורת ההפרעות של מטריצות, תחום שקיבל תשומת לב רבה במאה ה-20. בעבודות מוקדמות, כמו הספר של טוסיו קאטו(אנ') - "תורת ההפרעות לאופרטורים ליניאריים" משנת 1966, נדרשה רמת דיוק גבוהה יותר בניתוח מטריצות, דבר שהשפיע על התחום המתמטי והרחיב את הידע בהקשר של ניתוח ספקטרלי.[9] במקביל, אנליסטים נומריים תרמו להבנת יציבות ערכים עצמיים ותתי מרחבים עצמיים של מטריצות מופרעות, ובמיוחד דרך עבודותיהם של ג'יימס הארדי וילקינסון(אנ') ואחרים.

בשנת 1970 יצא משפט דייוויס-קהאן שהפך לכלי מרכזי בהבנת רגישותם של תתי מרחבים ספקטרליים להפרעות, בכך שהציע גבול ברור על הזווית בין מרחבים עצמיים של מטריצה ומטריצה מופרעת. תוצאה זו הייתה חשובה במיוחד לאנליסטים נומריים, והיא הובילה לפיתוחים נוספים בתחום. בשנת 1972, תוצאות אלו הורחבו על ידי וודין למטריצות לא הרמיטיות, מה שאִפשר את יישום התיאוריה גם במקרים של מטריצות מלבניות כלליות.[7] במאמר מ-2015 של יו טנגיאו וואנג וריצ'רד סאמוורת' הותאמה תוצאת דייוויס-קאהן להקשרים סטטיסטיים, עם תנאי הפרדה מקלים בין ערכים עצמיים של אוכלוסייה ומדגם, מה שהרחיב את השימוש בה ואפשר גישה ליישומים מעשיים.[8] בשנת 2018, שיפרו אלדרידג', בלקין ו-וואנג את חסמי ההפרעה הקלאסיים על ידי התחשבות ברעש אקראי. הם הציעו חסמים מדויקים יותר להפרעות בערכים עצמיים ובווקטורים עצמיים, והתוצאות עלו בביצועיהן על אלו של משפטים מסורתיים כמו משפט וייל ברבים מהמקרים המעשיים.[10] חשוב לציין שרשימת הפיתוחים הנ"ל אינה ממצה את מה שקיים בספרות המתמטית.

הקשר לתורת ההפרעות

משפט דייוויס-קהאן קשור ישירות לתורת ההפרעות, תחום במתמטיקה ובפיזיקה שמתמקד בניתוח השפעות של שינויים קטנים במערכות על הפתרונות שלהן. בתורת ההפרעות, נבחנים שינויים קטנים במטריצות, אופרטורים, או מערכות דינמיות, וכיצד שינויים אלו משפיעים על הערכים העצמיים, הווקטורים העצמיים או תוצאות אחרות.

המשפט והרחבותיו מהווה למעשה תוצאה בתורת ההפרעות עבור מטריצות, כאשר יש עניין באמידת השינוי שנגרם לווקטורים העצמיים בעקבות הוספת הפרעה קטנה. משפט דייוויס-קהאן מספק כלים פורמליים למדידת שינויים אלו.

דוגמה קלאסית לשימוש בתורת ההפרעות מופיעה בפיזיקה קוונטית, שם אופרטורים המייצגים גדלים פיזיקליים מתוארים כמטריצות הרמיטיות, והערכים העצמיים מייצגים תוצאות אפשריות של מדידות. הפרעות קטנות באופרטורים אלו, כגון שדה חיצוני, משפיעות על הערכים והווקטורים העצמיים של המערכת. תורת ההפרעות מאפשרת לחשב את השינויים האלו, ומשפט דייוויס-קהאן מספק חסמים לשינויים אלו עבור וקטורים עצמיים.

דוגמאות לשימושים

מודל Spiked Covariance

ערך מורחב – מודל Spiked Covariance

מודל זה עוסק באומדן וקטור עצמי מוביל של מטריצת שונות משותפת מדגמית. במצבים בהם הווקטור העצמי המוביל בולט בצורה משמעותית על פני וקטורים אחרים, באמצעות משפט דייוויס-קהאן ניתן להעריך את מידת הקרבה בין הווקטור העצמי האמיתי לבין זה שנאמד על בסיס דגימות אקראיות. באופן פורמלי, יהיו X1,...,Xni.i.d(0,Σ) וקטורים אקראיים ב - d. נניח שמטריצת השונות המשותפת, Σ היא Σ=θvvT+Id עבור θ>0 ו - vd וקטור בגודל יחידה (v=1). מההגדרה הנ"ל, הערך העצמי הגדול ביותר של מטריצה Σ הוא 1+θ עם וקטור עצמי מתאים v. אנחנו מעוניינים להסיק מהו v על סמך דגימות. תהי Σn=1ni=1nXiXiT ויהי vn הווקטור העצמי (בגודל יחידה) המוביל של Σn נשתמש בחישוב הבא:

vnv2=vnv,vnv=vn2+v2vn,vv,vn=22|vTvn|

כעת, מאי שוויון קושי שוורץ, |vTvn|vnv=1 לכן:

22|vTvn|22|vTvn|2=22|vTvn|2(vnv)2=22cos2((v,vn))=2sin2((v,vn))

מפני שההפרש בין הערך העצמי המוביל לכל הבאים הוא θ, נשתמש ב (הרחבה לסטטיסטיקאים של) משפט דייוויס-קהאן ונקבל:

vnv28ΣnΣF2θ2

תחת הנחות נוספות ניתן לקבל חסם על ΣnΣF והערכה על קצב הדעיכה של vnv.[11]

מודל בלוקים סטוכסטי

ערך מורחב – מודל בלוקים סטוכסטי

נראה שימוש למקרה פרטי של מודל בלוקים סטוכסטי. יהי גרף שקבוצת הקודקודים בו מחולקת לשתי קהילות שבה כל זוג נקודות בתוך הקהילה מחוברות זו לזו בהסתברות p וכל זוג נקודות בקהילות שונות מחוברות זו לזה בהסתברות q. מטריצת השכנויות של הגרף מוגדרת באופן הסתברותי כך ש-Ai,j מתפלג ברנולי בהסתברות p אם i,j באותה קהילה ומתפלג ברנולי בהסתברות q אם הם בקהילות שונות. נשים לב לכך שהתוחלת של המטריצה A היא:

P=𝔼(A)=[ppqqppqqqqppqqpp]

משמע 𝔼(A)i,j מטריצת בלוקים שכל אחד מארבעת הבלוקים מטריצה שמקבלת רק הערך p או q בהתאמה. אפשר להראות שהדרגה של P היא 2, שהערך העצמי המוביל הוא λ1=(p+q2)n והווקטור העצמי המתאים לו הוא:

u1(P)=1n[1111]

הערך העצמי השני הוא λ1=(pq2)n והווקטור העצמי המתאים לו:

u2(P)=1n[1111]

נרצה לנחש את הקהילות המקוריות באמצעות קירוב את הווקטור העצמי השני (אם u2(P)i=1 אז i בקהילה אחת ואם u2(P)i=1 אז i בקהילה השנייה). נשתמש במשפט הבא:

תהי E מטריצה ממשית מסדר n×n עם איברים eij שכל אחד משתנה מקרי בעל תוחלת 0 ומתפלג תת-גאוסית עם נורמת תת-גאוסית k. לכל t>0 קיים C קבוע כך שאי השוויון הבא מתקיים:[12]

(ECk(n+t))1et2

מכאן, מפני שהמטריצה נגדיר מטריצה חדשה E=AP מקיימת את תנאי המשפט, בהסתברות גבוהה מתקיים:

EopCn

בנוסף, ההפרש בין הערך העצמי השני לערכים העצמיים הקרובים אליו (הראשון והשלישי) של P הוא:

δ=min(p+q2npq2n,pq2n0)=nmin(q,pq2)

מכאן, בשימוש בהרחבה של משפט דייוויס-קהאן לסטטיסטיקאים, נקבל בהסתברות גבוהה שקיים ϵ{1,1} עבורו הווקטור העצמי השני מקיים:

u2(A)ϵu2(P)23/2Eopδ2Cmin(q,pq2)n

ניתן להראות שמספר האינדקסים בהם הסימן של ϵu2(P)i שונה מזה של u2(A)i שואף ל-0 כאשר n שואף לאינסוף. לכן, עבור n מספיק גדול, בהסתברות גבוהה מספר טעויות הסיווג יהיה קטן.[11]

ראו גם

תורת ההפרעות
משפט הפירוק הספקטרלי
ספקטרום (מתמטיקה)
פירוק לערכים סינגולריים
אי-שוויון וייל
מודל בלוקים סטוכסטי
מודל spiked covariance
תורת ההפרעות (מכניקת הקוונטים)

הערות שוליים

  1. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  2. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  3. ^ בתהליכי בנייה "תבנית:Cite web"
  4. ^ בתהליכי בנייה "תבנית:Cite book"
  5. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  6. ^ 1 2 3 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  7. ^ 1 2 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  8. ^ 1 2 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  9. ^ בתהליכי בנייה "תבנית:Cite book"
  10. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  11. ^ 1 2 בתהליכי בנייה "תבנית:Cite book"
  12. ^ בתהליכי בנייה "תבנית:Cite book"