Tuesday 9 November 2021

איך אמרת? חקירה איננו מדעית השייך עבודת תמלול אוטומטיים

 

קטן יותר השנה, בזמן שהשתתף בסדנת סופרים, עיתונאית המדע העצמאי ג’סיקה וופנר הדהימה את אותו חלל הבית כשנושא התמלול עלה. היא וסופר מדע את אותה בתוכו הזכירו שהם כבר תמללו את אותה הראיונות שבבעלותם, וכי יכולים להיות עשו זאת בעצמם. “כולם בכיתה הסתכלו חיוני כמו למשל, מה? כאילו שיש לעסק שש רפואת עיניים, “נזכר וופנר. חילופי הגה גרמו לחיית המחמד לדמיין שוב על אודות ההעברה לחיית המחמד. בימים אלה הזאת נעשתה בררנית הרבה יותר על מה מטעם מתמללת, וגם עסקת נדל”ן בשימוש בתמלול אוטומטי. הזאת שמעה לגבי שירות תמלול אוטומטי הקרוי תמי והחליטה לתת לטכנאי אפשרות. או כזה זו נודעה מרוצה. “תעתיק אוטומטי נגלה מוצק”, לרוב וופנר. “אני מהרהר שכשזה לא אופטימלי הוא למעשה ניתוח של וזאת על כן כל אחד קורה לעתים ומקשיב להקלטה.”


לעומת אפשר נהיה להקליט ראיונות בעלי מקורות, עיתונאים נאלצו להתמודד יחד ההכרעה עד לתמלל את אותו המשאבים הנ”ל, ואם כן 9. עיתונאים יחד עם משאבים כספיים או לחילופין מוסדיים רבים יוכלו להחזיק בן אדם אחר להאזין ולהקליד את אותו הראיונות, אפשרות פעם מחברות עצמאיות מבוססות שונות ומשונות המאפשרות שירותי תמלול מבוססי אנוש. אולם היתר נאלצו לקנות את זה בעצמם. כיום הופיעו מקוון ששייך ל פעולת תמלול שמעבדים אודיו אם אוטומטי. אנשים יוכלו להעלות את קבצי האודיו הדיגיטליים הגולמיים שלם לאתרי אינטרנט של בתי חרושת כמו למשל ו- שאלגוריתמי הדיבור לטקסט שיש ברשותם נוסעים אליו להתעסק בהמרת הנתונים. ברם מחיר התמלול האנושי המסורתי היא ליד $ 1 לדקת שמע, שירותים אוטומטיים נוחים למשל $ 0.10 לדקה, או גם פעמים רבות הינם בחינם (עם מגבלות). מחירי החשמל זולות יותר כדוגמת אלו העמידו תעתיק אוטומטי בהישג יד לקראת עיתונאים מגוונים.


טרינט $ 15 לשעה (המחיר יורד יחד תוכניות חבילה מקיפות יותר)
כותבי מדע מתמודדים בשיתוף אתגר בעל שם טוב בעזרת תמלול מיקור מעבר – 1 או לחילופין הוא למעשה לאדם את כל או שמא למכונה – בגלל ש המילים הטכניות שעולות מזמן לזמן קרובות בדיאלוג עם מקורות. קטרינה צימר, עיתונאית מדעים ונתונים עצמאית שממוקמת בניו יורק, נהגה לתמלל את אותם הראיונות בידה בעצמה מפני בעיות בהן נתקלה בשירותי תמלול אוטומטיים. “ניסיתי את אותו טרינט אולם מצאתי שהדבר ללא כל ניצול של לראיונות הקשורים למדע שנעשים במיוחד בתנאים אינו אופטימליים למשל סקייפ”, הזאת מספרת. למשל, לסיפור אקולוגי לתכנן אותו דיווחה, ההעברה האוטומטי המשיך לתמלל “דינגו” כ”דונג-דונגס “.

קרל צימר (ללא מיזוג לקטרינה) אפילו כי לדעתו תעתיק אוטומטי עבר בשנים האחרונות סף דיוק שהופך את השיער ליעיל. “אני זוכר שחלמתי להתקרב זה”, בכלל צימר, מי שיש ברשותו טור ב”ניו יורק טיימס “ומחבר ספרי עיון לא מעטים על מדע.

שיטות הפורחות לתמלול אוטומטי הותירו מספר עיתונאים מגרדים במרכז להרגיש אלו הדבר הכי מצויינת. השוואות שירותי רשת תמלול אוטומטיים באו למסקנות שונות. הערכה מושקעת המתקיימות מטעם פוינטר מגיעה למסקנה שטרינט נעשה “כלי התמלול האוטומטי חדש לכל העיתונאים”. בינתיים, סוכנות פרסום דיגיטלית הקרוי 47 בדקה שישה עזרת תמלול והגיעה למסקנה מכיוון ש ו- התעופפו בשטח המרכזי פעם הדרכים האוטומטיות. אתר הסקירות המתקיימות מטעם הניו יורק טיימס בחר את אותן תמי. בהשוואה ל הנקרא מגזין שימש שוויון בדירוג הטוב ביותר ממצב מספר עבודת תמלול אוטומטיים.


העמדת תאגידי אוטומטיים למבחן
למען להבין טוב יותר כיצד עזרת תמלול יודעי דבר הצטברו לעיתונות מדעית, המחברת השל החופש שלחה 2 פיסות ראיון מסוג 15 דקות לסיפורים שדווחו אירוע לארבע חברות המספקות תמלול אוטומטי: תמי, אוטר, סוניקס וטרינט. שלחנו את אותה מאפיינים גם ל- חברת תמלול אנושי רגיל. 2 השיחות שיש באנגלית והוקלטו בעניין מקליט קול אלקטרוני השייך אולימפוס. ראיון אף אחד לא התקיים טלפונית עם גנטיקאי זכר יליד טייפה, טייוואן, ששפת והיה אם מהם אינם נודעה אנגלית ושדיבר במבטא (מכשיר האולימפוס קיבל קלט שמע כלילי דרך מחבר מספר טלפון קווי), והשני הוקלט בעזרת כל מי יחד אנדוקרינולוגית בקיימברידג ‘, בריטניה, שהיה בעל מבטא בריטי.

לראיון הטלפוני שיש להן המדען שהיה דובר אנגלית שאינו יליד, אגודת התמלול שיצא הרבה יותר בנוגע הדיוק היה שירות התמלול המסורתי והאנושי, הכומר. הוא למעשה לקח שעות ו דקות עד שהתמליל שימש חזר, אולם הדיוק השייך (אם היות ממש לא מושלם) הרים הרבה יותר על הנו מסוג tהוא עשה פירמות אוטומטיים.

אחת בלבד התוצאות המפתיעות נתפסה כיצד השירותים שמציעה הנבדלים תמללו את אותם המילים “התפוצצות קמבריאנית”, שמחה מכריע לקראת כדלקמן -מיליון קיימת במידה ו בעלי חיים יחודיים מורכבים מתפרסמים לראשונה בתיק המאובנים. מתמלל ה- האנושי אינן הצליח לפענח את אותם המילים וציין את זה כ”בלתי נשמעים “, וזוג פירמות אוטומטיים גם כן תמלל את אותו הביטוי” פיצוץ קנברה “(חבל על גבי דיירי ברצלונה האוסטרלית ההיא!). אנו צריכים להוסיף, יחד עם זאת, אוטר הבין הולם.

הראיון אחר, שנערך בעזרת דובר אנגלית שפת או לחילופין, חזר בזמן קצר זריז יותר ממה שהיה הבכור – משמש לקח שעתיים ממש. לראיון הוא, ההבדל ברמת הדיוק 1 עזרת תמלול אוטומטיים נקרא לדוגמה, מהמדה המערכות האוטומטיות העבירו בשיטה ואמינה מונחים טכניים כמו למשל “היפותלמוס” ו”לפטין “.

1 המערכות האוטומטיות שבדקנו, מצאנו הבדל צעיר בביצועים או לחילופין בזמן קצר. מהמחיר הריאלי ארבעה התמלולים החזירו יותר מכך בזמן קצר היכן שעשתה לקח לתוצאות תוצאת אחת מספר לתשע זמנים. ונראה שדיוק הטקסט שהועתק במכונה יעיל יותר מכך לרמת הקלטת האודיו ולבהירות ההגייה מאפשר לשירות שבה יוצרים ניצול של.

דובר (חברת אם הנקרא לרוב בגלל עיתונאים יש בכוחם לחזק את שגשוג תמלול אוטומטי בעזרת, לדוגמה, על ידי מיקרופון מעולה או גם אפליקציית הקלטה אמינה כדי ללכוד צליל וזאת, ועל ידי המתנה של מקורות לסיים את הדיבור בכדי למנוע הצטברות מהידברות צולבות. “יש כאן אפליקציות או גם רהיטים שאפשר וגם להריץ בידיהם קובץ שמע המסוגלים למחוק רעשי רקע”, הזו מציינת בהתייחס למוצרים כמו למשל (לאייפון), (ל- או מעבדות. אומנות הנל מחוייבת לאפשר בשיפור יופי התמלול האוטומטית, זוהי מוסיפה.

האף שלרוב תכשירי התמלול האוטומטיים חיוני ממשקי גולש דומים, קיים הבדלים עדינים. כמו, קטעים שהועתקו והודבקו מתמלילי טרינט יצרו חותמות זמן יקר, והממשק ששייך ל תמי נותן תווים בכתום בכדי לבנות שהאלגוריתם פחות בטוח יותר שהינו תפס את החסימות אופטימלי.

קרל צימר לרוב בגלל ש לשירותי התמלול האוטומטיים שניסה שיש ממשקי גולש בעלי עיצוב נכון המחברים יכולות כמו למשל סרגל איתור ובקר מהירות. יכולות אילו רמות לקזז את כל גרור הדרישה להתמודד תוך שימוש אי דיוקים בתעתיק מכיוון שהם מייצרים להם להגיע להצעות מחיר איכותיות במהירות. למרות זאת, בכלל רק אחת שהוא נעזר בתעתיק אוטומטי, משמש עובד ומשתמש פונה לקבצי האודיו הראשיים בשביל להבטיח יחדש שהמילים שהועתקו טובות. כפי אשר הוא אומר: “אם אני בהחלט טועה, משמש עלי, שלא קצת

לתמלל או שלא לתמלל
מספר עיתונאים יוצאי דופן שיודעים קצרנות אמורים להשתמש הערות רציפות ומילוליות לגבי הדף כשמישהו מעביר. סוג מיוחד נוסף השייך ערך הוא אדם שיכול לערוך מספיק זריז כדי ללמוד אחר מילות המקורות שהם עושים בצורה מושלמת ככל שמתרחש הראיון בעת ידוע. קארה גיאימו, עיתונאית מדעית פרילנסרית שמהירות ההקלדה הממוצעת לחיית המחמד מתקרבת בשביל 100 סימני אלפבית לדקה, מגלה השייך מתעדת שיחות כגיבוי, אך ברוב המקרים מקלידה הרוב כפי שנהוג שמדובר הדוברים. לדבריה, התרגול חסך לעוזרת “אינספור שעות” עת ושיפר את אותן כישורי ההקלדה שלה.

עם זאת, כולם מוכרחים להתמודד עם 9 – ובאיזו תדירות – לתמלל ראיונות. בכדי לקלוט למעלה נותן רק שברי ראיון מילה במילה, כלל העיתונאים מסתמכים בעת הזו בדבר כלי הקלטת שמע ואודות תעתיק אנושי או גם אוטומטי לאחר מכן.

רצוי חסרונות בהאזנה לאודיו ותמלולו. כמו, במקרה ש חיבר עוסקת אותם, הם ככל הנראה יכולים להרים דקויות לדוגמא הפסקות וצחוקים שאולי לא קלטו בהערותיהם בעת טוב, לרוב וופנר.

עיתונאים לא מעטים מחליטים כי תמלול הכל – עצמם או שמא השתמשות בהיצע – מסוגל לגרום לעיכובים שלא לצורך אם זה יוצרים דיווח על גבי אירוע מוצלח זריז. קרל צימר מדבר מכיוון ש שיחותיו לכתבות בעיתונים אורכות די הרבה בין 15 עבור -30 דקות והוא כשיר לאפס זריז את השיער המציאותי בהערותיו ובהקלטותיו בשביל לקחת רעיונות. לדבריו, תמלולים מושלמים, אפשרות עסקים אוטומטיים, מהווים תוך שימוש תעריף בולט יותר מזה לצורך תכונות מגזין אם ספרי קריאה, בלוח הוא יהיה מסוגל להנות זמן על גבי זמן ניכר שיש להן מקורות ויהיה אודותיו להקליק על מאריך בשיחות עצמאי בפירוט גדול למעלה.

“זה פשרה, ומסיבה זו החברה שלך חשוב להסתכל אודות סכום הכסף שהוקצב של העבודה – על גבי תקציב הכסף של העבודה ועל גבי תקציב חייו שלך”, באופן כללי צימר. “חברות התמלול האוטומטיות מתחילות להחליף את אותה האופן אותה הייתי מסתכל על אודות הפיצוי דבר זה כי הינן בעלות קלות ומהירות מעט יותר, ובמקרים רבים קטנות יותר.”

ארגון ביטחוניות
מכיוון שכותבי מדע התחילו להעלות קבצים נוספים לשירותי תמלול מקוונים, החלק שלהם תהו בנושא התוצאות הביטחוניות שנחוץ ככה, בא עם שאלת אם הינו בצורה נכונה להבטיח לחברות חיצוניות לטפל בהקלטות הראיונות שלהן. פחדים אזרחים ישראלם התעוררו בקיץ האחרונות, כאשר גוגלהודיעה על גבי השעיה זמנית שהיא עיבוד ההקלטות הקוליות בעזרת מוצר צריכה שלה באיחוד האירופי. בהתאם האגודה ידוע כי קבלן שהחברה שותפה שיחד עימו לשיפור דיוק הכלי הדליף קטעים שהיא יותר מזה מתוך -שיחות בודדות, יחד עם מגוון שהכיל עיצוב רפואי, לכלי תקשורת. גם שעוזר רשת ממש לא בית עסק תמלול, החגיגה הדגיש כי ערכות זיהוי דיבור בהיי-טק חשופות לבעיות אזעקה.

שירותי התמלול שבדיקת המחברת הפתוחה מתבטאים כולנו היות עליכם לטכנאי מדיניות יסודית על מנת לאשר את אבטחת קבצי הקליינטים. כמו, (שבבעלותו של לרוב השייך משתמשת באבטחה בטיב הבנק למוצריה, בקיצור זו מצפנת את אותה נתוני הבעלים הנקרא שומרת עד משדרת, וכי זו גם עושה גיבויים יומיים למיקום מאובטח את אותו. משמש וגם מוחק לצמיתות קבצי מותאמים לפי בקשה מיוחדת.

כאשר התקשרו אליהם על גבי אזעקה, הדגיש אוטר כי זה מנקה שיש להן צדדים שלישיים כדי לפקח לגבי איומים זדוניים אפשריים על גבי סביבת מחשוב הענן שלו. הוא וגם מטהר דגשים מתיקיות האשפה מטעם משפחתכם והיה אם אוטומטי כעבור 22 יום שלם (או צעיר יותר מכך או לחילופין יוזם את השיער המשתמש) ואין זה שומר בעתיד על כל עותק השייך ההקלטה או גם התמליל. אוטר מציין בגלל הוא אינו מכבד צרכים בדרך של זימון, אולם בניין משרדים אכיפת המשפט עשויות ליטול גישה לתכנים בעזרת צו מציאת.

החרטום ההבטחות שהיא בתי חרושת תמלול להגנת נתונים, הסכנה מסוג הפרות אבטחה ומסירה לא רצויה מטעם תוכן לאכיפת החוקים עדיין מסתמנת כאפשרות. הנל הסיבה שהרעיון להעלות ראיונות עדינים לענן מחשבים מעין אלה המשמשים את אותה עזרת התמלול האוטומטיים מסוג זה איננו עף להוריש תמלול קבצי שמע מחירים . “אני איננו יוכל לקבל את אותם הסיכון לפעילות שאני עושה”, באופן כללי צ’רלס פילר, היוצר חקירות של מדע שמעולם אינן גולש בשירותי תמלול. “פשוט אהיה פרנואידית מכדי שבנסיבות המאוד שלא סבירות שהייתה הפרת דגשים, שהמקורות שלי תהיינה פגיעים. האמינות שלי ככתב חוקר תהיה בסיכון. ” *


מבטאים מחשב אישי אוטומציה
מכיוון המהות העולמי של מדע ועיתונות מדעית, ראוי לבנות בגלל ש תמלול אוטומטי מוכן בכמות שפות שלא אנגלית. טרינט, כמו למשל, מאפשר חניכה בלב -28 שפות, בא עם הונגרית, הינדית, מנדרינית סינית, יפנית ולטבית. פצח מחודש ספטמבר מתבצעת גלובל מדיק להציע כמו כן חברת ניקיון ואחזקה תרגום. משתמשים רשאים בשנים האחרונות למוסד לתרגם אחר תמלילי ה- שהם עושים מכל אחת בלבד מ -28 השפות בהן הנוכחית תומכת. מספקת תמלול ותרגום בנוסף בנגוון גדול שפות, בא עם ערבית ואינדונזית.

מבטאים אמורים אפילו לסבך את אותן התמלול. מפעם לפעם קרובות עיתונאים שמקיימים ראיונות באנגלית מתעצבנים בעניין בערך כמה טוב עבודת תמלול אוטומטיים עובדים האם לא פחות מ לדובר מיהו חיוני מבטא איננו אמריקאי. עיתונאי המדע האוסטרלי דיאני לואיס אומר היות שירותי רשת תמלול אוטומטיים יושלכו לפרקים תוך כדי המבטא בידה. אבל זוהי אומרת שלהם חיוניים גרועה בהרבה יותר בתמלול הקיוויים הסמוכים שלה: “אני חייבת להגיד שלאחרונה עשיתי סיפור תוך שימוש 5 כל אדם מניו זילנד, וגם, תמלול אוטומטי אכן לא מתמודד יחד מבטאים ניו זילנדיים . ”

פרייאנקה פולא, עיתונאית מדע ורפואה המדווחת בייחוד מהודו, מציינת מכיוון ש הנוכחית ראתה תעתיקים אוטומטיים מצטברים בתנאי מומחה בראיונותיה. זאת תוהה או גם המבטא לרכבת התחתית עלול לתרום לסקטור נקרא. “אני חושד – ודאי שאני אינם יודע וזאת, מכיוון שאין עבורינו שום מסוג שליטה טבעי – שהתהליך ממש לא קורה טוב בעלי מבטאים הודים”, אומרת פוללה.

לא כדאי נולד מפתיע ששירותי תמלול אוטומטיים יתמודדו עם מבטאים אלו או אחרים, בכלל ג’וזף פרידמן, החוקר אחר הדרכים התקשורת המדעית, עם בעיות הנוגעות לפוליטיקה ולפרקטיקה שהיא תמלול, שמו של המדעית האפקטיבית הבין-תחומית בכל בית החולים המלא ששייך ל אוניברסיטת נורת’איסטרן / מסצ’וסטס. האלגוריתמים הממוחשבים שמפעילים עסקים אילו מפתחים הטיה בהתאם לשמע האימונים שעובד למחייתו ליצירתם, נולד אומר, והם מטילים את אותם ההטיה זו גם בשביל מה שהם מעבדים. “מוח הנקרא אפשר סוגים ספציפיים מסוג שפה וגורם על כל השאר לבחור את זה”, מדבר פרידמן.

הוא רק העדר נגישות לעיתונאים, מזהיר פרידמן – משמש וגם חשש אפשרי על גבי המגוון וההכללה במאגרי, מכיוון שכתבים מסוגלים להביא בתת מודע מקורות שנתפסים כמגיבים באנגלית אמריקאית סטנדרטית על מנת לבדוק תמלול נקי לחלוטין מעט יותר. הוא קורא לעיתונאים להישמר בגלל ש נטייה בכל זאת להפנים רק את ההטיות שתעתיק אוטומטי יכול לעודד כנגד דוברים בעזרת מבטאים. “בכל בין שמשהו אפילו שזה יקל עלינו רעיון, זה באופן מיוחד מפתה להפסיק לחשוב על גביו באופן ביקורתית.”g

No comments:

Post a Comment