A NGR, המכונה גם בדרך כלל N-gram, הוא ניתוח סטטיסטי של טקסט או תוכן דיבור למצוא n (מספר) של איזה פריט בטקסט.
פריט החיפוש יכול להיות כל מיני דברים, כמו פונמות, קידומות, ביטויים או אותיות. למרות N- גרם הוא קצת מעורפל מחוץ לקהילת המחקר, הוא משמש במגוון תחומים ויש לו הרבה השלכות עבור מפתחים קידוד תוכניות מחשב להבין ולהגיב לשפה המדוברת הטבעית.
במקרה של Google Ngram Viewer, הטקסט שיש לנתח מגיע מהכמות העצומה של הספרים ש- Google סרקה מתוך ספריות ציבוריות כדי לאכלס את מנוע החיפוש של Google ספרים. עבור Google Ngram Viewer, הם מתייחסים לטקסט שאתה הולך לחפש בתור קורפוס . NGR Viewer צובר לפי שפה, למרות שאתה יכול לנתח בנפרד אנגלית בריטית ואנגלית או לגבש אותם יחד.
איך Ngram עובד
-
עבור אל Google Ngram Viewer בכתובת books.google.com/ngrams.
-
הקלד את הביטוי או את הביטויים שברצונך לנתח. הפרד כל ביטוי עם פסיק. גוגל מציעה, "אלברט איינשטיין, שרלוק הולמס, פרנקנשטיין" כדי להתחיל. פריטים רגישים לרישיות, בניגוד לחיפושים של Google.
-
הקלד טווח תאריכים. ברירת המחדל היא 1800 עד 2000.
-
בחר קורפוס. ניתן לחפש טקסטים בשפה זרה או באנגלית, ובנוסף לבחירות הסטנדרטיות, ייתכן שתראה דברים כמו "אנגלית (2009) או אנגלית אמריקאית (2009)" בתחתית הדף. אלה הם קורפורדה ישנה יותר ש- Google עודכנה, אך ייתכן שיש לך סיבה לעשות את ההשוואות שלך כנגד קבוצות נתונים ישנות. רוב המשתמשים יכולים להתעלם מהם ולהתמקד הקורפורדה האחרונה.
-
הגדר את רמת החלקה שלך. החלקה מתייחס עד כמה חלקה הגרף בסוף. הייצוג המדויק ביותר יהיה רמת החלקה של 0, אבל הגדרה זו עשויה להיות קשה לקריאה. ברירת המחדל מוגדרת ל -3. ברוב המקרים, אין צורך להתאים אותה.
-
לחץ על חפש הרבה ספרים כפתור.
Google מאפשרת לך לתחקר לא מעט עם NGR Viewer. אם אתה רוצה לחפש דגים הפועל במקום דגים שם עצם, אתה יכול לעשות זאת באמצעות תגים. במקרה זה, תחפש "fish_VERB"
Google מספקת רשימה מלאה של פקודות שניתן להשתמש בהן ותיעוד מתקדם אחר באתר האינטרנט שלהן.
מה זה NGR?
Google Ngram Viewer יציג גרף המייצג את השימוש בביטוי מסוים בספרים לאורך זמן. אם הזנת יותר ממילה או צירוף מילים אחד, תראה שורות מקודדות בצבע כדי להציג את מונחי החיפוש השונים. זה די דומה ל- Google Trends, רק החיפוש מכסה תקופה ארוכה יותר של זמן.
מקרה בוחן
שקול את מקרה המחקר של פשטידות חומץ. הם מוזכרים בלורה אינגלס וויילדר בית קטן בערבה סדרה. היכרות עם החיפוש של גוגל באינטרנט כדי ללמוד עוד על פשטידות חומץ מגלה כי הם נחשבים חלק המטבח הדרומי האמריקאי באמת עשויים חומץ. הם משמיעים חזרה כאשר לא כולם היו גישה תוצרת טרייה בכל עת של השנה. אבל זה כל הסיפור?
חיפוש ב- Google Ngram Viewer עבור חומץ פאי ואתה תיתקל כמה הפסקאות של העוגה בשני בתחילת 1800s בסוף, הרבה אזכורים של 1940s, וכן מספר גדל והולך של אזכורים בתקופה האחרונה. עם זאת, עם רמת החלקה של 3 תראה הרמה מעל האזכורים של 1800. מאחר שאין הרבה ספרים שפורסמו במהלך הזמן הזה, ומכיוון שהנתונים שלנו מתוכננים להחליק, הוא מעוות את התמונה. קרוב לוודאי שהיה שם ספר אחד שהזכיר עוגת חומץ, ופשוט הגיע לממוצע, כדי למנוע ספייק. על ידי הגדרת החלקה ל 0, אנו יכולים לראות שזה בדיוק המקרה. ספייק מתרכז ב 1869, ויש עוד ספייק ב 1897 ו 1900.
זה לא סביר שאף אחד לא דיבר על פשטידות חומץ את שאר הזמן: היו מתכונים סביר צף בכל מקום, אבל אנשים פשוט לא לכתוב עליהם בספרים, וזו מגבלה חשובה של חיפושים אלה.




