/ / Wie entferne ich unerw├╝nschte Inhalte aus heruntergeladenen Untertiteln? - youtube-dl

Wie entferne ich unerw├╝nschte Inhalte aus heruntergeladenen Untertiteln? - youtube-dl

Automatisch generierte YouTube-Untertitel enthalten Zeitstempel f├╝r jedes Wort und andere Inhalte, die die Lesbarkeit beeintr├Ąchtigen:

00:00:30.230 --> 00:00:33.900 align:start position:19%
you<00:00:31.230><c> think</c><c.colorE5E5E5><00:00:31.470><c> from</c><00:00:31.650><c> my</c><00:00:31.740><c> calm</c><00:00:31.980><c> demeanor</c><00:00:32.010><c> that</c></c><c.colorCCCCCC><00:00:32.430><c> I</c></c>


00:00:32.580 --> 00:00:36.180 align:start position:19%
haven"t<c.colorE5E5E5><00:00:32.760><c> got</c><00:00:32.910><c> a</c><00:00:32.940><c> care</c><00:00:33.150><c> in</c><00:00:33.210><c> the</c><00:00:33.330><c> world</c><00:00:33.420><c> that</c></c>

00:00:33.900 --> 00:00:38.160 align:start position:19%
you"d<00:00:34.019><c> be</c><00:00:34.140><c> wrong</c><00:00:34.410><c> you</c><00:00:34.680><c> see</c><c.colorE5E5E5><00:00:35.000><c> hidden</c><00:00:36.000><c> within</c></c>

Wie kann ich nur mit vern├╝nftiger Sprache sparenFormatierung? Sprachorientierte Videos einiger Benutzer werden in Stunden statt in Minuten gemessen, und durch Lesen konnte ich diese "Ein-Mann-Talkshows" in Bruchteilen der Zeit beenden.

Antworten:

1 f├╝r Antwort Ôäľ 1

Mach Folgendes:

  1. Machen Sie eine Kopie der Datei.
  2. ├ľffnen Sie die Datei in einem Texteditor, der ├╝ber Regex-basierte Funktionen zum Suchen und Ersetzen verf├╝gt, z Notepad ++ oder Visual Studio-Code.
  3. Rufen Sie die Funktion Suchen und Ersetzen auf (Strg+H Suchen Sie in den Beispielen, die ich gegeben habe, den folgenden regul├Ąren Ausdruck und ersetzen Sie ihn durch nichts:

    <.*?>
    

    Vergessen Sie nicht, den Regex-Modus zu aktivieren. In Notepad ++ m├╝ssen Sie das Optionsfeld "Regul├Ąre Ausdr├╝cke" ausw├Ąhlen, und in Visual Studio Code m├╝ssen Sie auf die Schaltfl├Ąche mit der Aufschrift ". *" Klicken (oder dr├╝cken Sie Alt+R)

  4. Ersetzen Sie alle Instanzen.

Hier ist das Ergebnis von Visual Studio Code:

00:00:30.230 --> 00:00:33.900 align:start position:19%
you think from my calm demeanor that I

00:00:32.580 --> 00:00:36.180 align:start position:19%
haven"t got a care in the world that

00:00:33.900 --> 00:00:38.160 align:start position:19%
you"d be wrong you see hidden within