subs.sab.bz - Информация
Здравейте ( Вход | Регистрация )
subs.sab.bz - Информация
![]() ![]() ![]() |
![]() |
![]()
Коментар
#151
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 378 Регистриран: 17-July 09 Град: Кюстендил Потребител No.: 96 732 Статус: Офлайн ![]() |
Идеята ми дойде по време на контролно ![]() ![]() ![]() |
------------------------------------ |
|
|
|
![]()
Коментар
#152
|
|
![]() -= DH team =- ![]() Качени субтитри Група: Ментори Коментари: 395 Регистриран: 10-March 09 Град: Стара Загора Потребител No.: 90 214 Статус: Офлайн ![]() |
tonyy, предполагам, че това няма да е лесно, а за ТОЙ и ТО се съмнявам, тъй като ТО също е самостоятелна дума. ![]() Soler, искам да ми пише домашнитеее! ![]() Този коментар е бил редактиран от MichaelZ на Dec 4 2009, 05:27 PM |
------------------------------------ yve_sl (19:18:02 13/09/2010)
Мише, внимавай, лелиното, с тези съпруги да не се отчаяш. :D "It's gonna be legen...wait for it...dary!" |
|
|
|
![]()
Коментар
#153
|
|
![]() научно-популярен човек ![]() Качени субтитри Група: Ментори Коментари: 1 019 Регистриран: 22-December 06 Потребител No.: 26 Статус: Офлайн ![]() |
Направо следващата версия да пише домашни и да прави контролни. ![]() |
------------------------------------ Yes, London. You Know: Fish, Chips, Cup 'o Tea, Bad Food, Worse Weather, Mary Fucking Poppins... LONDON.
|
|
|
|
![]()
Коментар
#154
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 378 Регистриран: 17-July 09 Град: Кюстендил Потребител No.: 96 732 Статус: Офлайн ![]() |
MichaelZ, точно това е целта, при изпускане на буква да се получава друга съществуваща дума.
|
------------------------------------ |
|
|
|
![]()
Коментар
#155
|
|
![]() Скалолазка-парапланеристка ![]() Качени субтитри Група: Глобални модератори Коментари: 1 903 Регистриран: 25-January 07 Град: Майнатаун Потребител No.: 2 995 Статус: Офлайн ![]() |
tonyy, ако преводачът не знае родния си език, никоя програма няма да може да му помогне. Аз съм ЗА програмите, правещи спелчек, защото при писането всеки от нас понякога разменя някоя буква със съседна, но да разчитам, че програмата ще ми оправи пунктуацията, да намира съществуващи думи при изпуснати букви - това е смешно. Всеки средноинтелигентен човек трябва да знае добре правилата за правопис и пунктуация на родния си език. Да не говорим за хора, които като нас са се наели да превеждат филми, които ще бъдат гледани от много други хора. Не бива да се разчита на програми за неща, които човек би трябвало да е научил до 12 годишната си възраст.
|
------------------------------------ yve_sl (21:07:31 14/06/2007)
ти що не го преведе този филм? Best Ripper (21:08:10 14/06/2007) аз ли требе да преведа и оправя всите филми в нета? yve_sl (21:08:20 14/06/2007) да Best Ripper (21:08:32 14/06/2007) а не може ли всите булки да оправя? yve_sl (21:08:49 14/06/2007) може, ама първо филмите ![]() |
|
|
|
![]()
Коментар
#156
|
|
![]() -= Новак =- ![]() Качени субтитри Група: Потребител Коментари: 4 Регистриран: 2-December 09 Потребител No.: 103 145 Статус: Офлайн ![]() |
Двете тирета "--" са оправени във версия 1.59, но сега символите ">" и "<" ги третира като грешки.
|
|
|
|
|
![]()
Коментар
#157
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 378 Регистриран: 17-July 09 Град: Кюстендил Потребител No.: 96 732 Статус: Офлайн ![]() |
Може би не ме разрахте, но няма значение... ![]() |
------------------------------------ |
|
|
|
![]()
Коментар
#158
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: Потребител Коментари: 160 Регистриран: 8-May 07 Град: Варна Потребител No.: 27 843 Статус: Офлайн ![]() |
Не исках до коментарът ми да прозвучи като опит за спор. Просто от твоето мнение останах с впечатление, че едва ли не щом искаме допълнителна функционалност по един коректор, то имаме проблеми с грамотността си ![]() Явно станахме жертва на Първия форумен закон - "Ако мнението ми може да бъде разбрано погрешно, то непременно ще бъде разбрано погрешно." ![]() Този коментар е бил редактиран от peterx на Dec 4 2009, 10:38 PM |
------------------------------------ Perfection is only a goal.
Striving for it is what we are living for. "Love is the emptiness which binds our souls." |
|
|
|
![]()
Коментар
#159
|
|
![]() Скалолазка-парапланеристка ![]() Качени субтитри Група: Глобални модератори Коментари: 1 903 Регистриран: 25-January 07 Град: Майнатаун Потребител No.: 2 995 Статус: Офлайн ![]() |
peterx, нямам намерение да влизам в безплодни и безкрайни спорове с когото и да било. Изразих собственото си мнение (имам право на такова), без да ангажирам никого с него. Всеки, който иска, да ползва каквито иска програми - те затова се правят, за да са в помощ на потребителите. Лично аз разчитам на собствената си грамотност.
Този коментар е бил редактиран от yvetted на Dec 4 2009, 09:47 PM |
------------------------------------ yve_sl (21:07:31 14/06/2007)
ти що не го преведе този филм? Best Ripper (21:08:10 14/06/2007) аз ли требе да преведа и оправя всите филми в нета? yve_sl (21:08:20 14/06/2007) да Best Ripper (21:08:32 14/06/2007) а не може ли всите булки да оправя? yve_sl (21:08:49 14/06/2007) може, ама първо филмите ![]() |
|
|
|
![]()
Коментар
#160
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 173 Регистриран: 17-September 09 Град: Плевен Потребител No.: 98 918 Статус: Офлайн ![]() |
Двете тирета "--" са оправени във версия 1.59, но сега символите ">" и "<" ги третира като грешки. Не са грешки. Символи като $ | @ # > < и някои други просто се броят и се показва броят им. Имай предвид, че като изключим субтитрите, в повечето други текстове тези символи обикновено са съмнителни (случайно натиснат клавиш и пр.), затова проверяващият веднага трябва да може да види какви други "гарги" съдържа текста му освен стандартните буквено-цифрени комбинации. Не е проблем да сложа опция "Режим субтитри" и при включването й да не се показва статистика за > и <, които са част от тайминга и форматирането на текста (тагове като <i> и пр.). При всички случаи показването им не пречи чак толкова. Този коментар е бил редактиран от ivan4 на Dec 5 2009, 12:15 AM |
|
|
|
|
![]()
Коментар
#161
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 173 Регистриран: 17-September 09 Град: Плевен Потребител No.: 98 918 Статус: Офлайн ![]() |
Може да се добави функция за превръщане на код от латиница на кирилица за еднаквите символи в двете азбуки. Примерно когато се свалят субтитри на български от блу-рей, програмата за OCR не прави разлика между "а", "е", "о", "с" и т. н., но те имат различни кодове за латиница и кирилица, така че става смесване. Готово: Версия 1.60 1. Откриват се потенциални български думи, написани изцяло с латински букви. Досега програмата засичаше само думи, в които има смесен текст, тоест едновременно латински и кирилски букви. Вече думи като "Не", "ce" и прочие, написани изцяло с латински букви, също се засичат и като предложение за корекция се предлага българския вариант и коригирането става с едно кликване в левия панел (не е нужно да пренаписвате думата ръчно). Прави се проверка дали предната и следващата дума са на латиница и ако това е така, думата не се отчита като потенциална грешка, тоест в израза "He is a boy", първата дума няма да се счита за потенциална грешка, защото Чекърът ще извършва проверката в режим "английски език". Алгоритъмът на намиране на съответствия на отделните букви позволява известна свобода, иначе казано не е задължително буквите да изглеждат абсолютно еднакво, достатъчно е да са близки (напр. r-г, n-п, u-и) и затова в някои редки случаи може да се открият фалшиви грешки или предложенията за корекция да са доста смешни. Например ако думата "year" се срещне между две български думи, програмата би Ви предложила българския текст "уеаг" (year и някои други английски думи са в изключващ списък, тоест никога не се появяват като възможни OCR грешки). Нарочно не правя проверка дали генерираното българско предложение е валидна дума, тъй като това би ограничило засичането на някои видове грешки. Например в израза "Же Ве Це" (сам по себе си неправилен) втората дума може да е написана на латиница вместо на кирилица и въпреки че българска дума "Ве" липсва в българския словоформен списък, програмата ще Ви я предложи като корекция. Ако дадена думи на латиница съдържа букви като t, i, s и пр., които много рядко са OCR грешки на български букви, тези думи никога не се листват като възможни OCR грешки, дори да са между две български. Срещал съм изключения, например "Ji" вместо българската "Л". Този коментар е бил редактиран от ivan4 на Dec 6 2009, 07:39 AM |
|
|
|
|
![]()
Коментар
#162
|
|
![]() -= Новак =- ![]() Качени субтитри Група: Потребител Коментари: 4 Регистриран: 2-December 09 Потребител No.: 103 145 Статус: Офлайн ![]() |
Цитат(ivan4) Не са грешки. Символи като $ | @ # > < и някои други просто се броят и се показва броят им. Имай предвид, че като изключим субтитрите, в повечето други текстове тези символи обикновено са съмнителни (случайно натиснат клавиш и пр.), затова проверяващият веднага трябва да може да види какви други "гарги" съдържа текста му освен стандартните буквено-цифрени комбинации. Не е проблем да сложа опция "Режим субтитри" и при включването й да не се показва статистика за > и <, които са част от тайминга и форматирането на текста (тагове като <i> и пр.). При всички случаи показването им не пречи чак толкова. Според мен най-удачният вариант е да има такава опция, която по подразбиране да е изключена, но да може да се запомня при включване, защото иначе стават много такива думи и символи, дето само се броят, но те отклоняват вниманието от съществените грешки. Ето такъв случай имах предвид за смесване на латиница и кирилица: Този коментар е бил редактиран от simo76 на Dec 5 2009, 12:58 AM |
|
|
|
|
![]()
Коментар
#163
|
|
![]() -= Ветеран =- ![]() Качени субтитри Група: Глобални модератори Коментари: 868 Регистриран: 22-December 06 Потребител No.: 35 Статус: Офлайн ![]() |
Може би не ме разрахте, но няма значение... ![]() Напротив, смятам, че всички са те разбрали правилно. Но само си представи колко думи в превода ще бъдат маркирани като потенциално незавършени и колко предложения ще изкара програмата за тях. напр. ТО - той, но и топ, тор, тоз, ток, том, тон; или ДА - дай, дал, дан и доста други комбинации. И най-прекрасната програма за автоматична проверка не може да предвиди всички човешки грешки, затова най-добре си изчитай субтитрите като ги приключиш. (доста често можеш да срещнеш грешки от типа: СЕ вместо СИ или СА). Не си представям какъв алгоритъм ще ги открие. По тази логика всяка дума от превода трябва да се анализира и подложи на проверка. Този коментар е бил редактиран от Zaza14 на Dec 5 2009, 01:42 AM |
------------------------------------ ![]() ![]() |
|
|
|
![]()
Коментар
#164
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 173 Регистриран: 17-September 09 Град: Плевен Потребител No.: 98 918 Статус: Офлайн ![]() |
Ето такъв случай имах предвид за смесване на латиница и кирилица: Този пример е уникален! ![]() Я пробвай следното: 1. Отваряш Чекъра. 2. Включваш опцията "Генерирай коригиран файл". 3. Отваряш файла (чрез менюто или чрез влачене и пускане в десния панел). Поглеждаш в папката, в която е файла и виждаш един файл с префикс "AUTO_". Това е автоматично коригираният файл. Сега лошата новина. Въпреки че в твоя случай така ще се оправят 90% от грешките (около 50% при нормални субтитри), ще има и правилни думи, които програмата ще е заместила с грешни. Също така пунктуационните грешки, ако ги има, ще останат непокътнати. Думите с главна буква също се прескачат, тъй че поне 10% от думите със смесен текст ще останат неоправени. Заради всичките тези проблеми трябва да отвориш новия "AUTO_" файл в Чекъра и ръчно да го докоригираш, изчитайки внимателно текста вдясно дума по дума. Не трябва да разчиташ само на левия панел заради потенциалните грешни замествания на автокорекцията. Тази автоматична корекция съм я писал за около час и предстои да отделя седмица-две да я направя наистина работеща. Засега опцията може да се ползва единствено за случаи като този на скрийншота. Този коментар е бил редактиран от ivan4 на Dec 5 2009, 09:07 AM |
|
|
|
|
![]()
Коментар
#165
|
|
![]() -= Ветеран =- ![]() ![]() ![]() Качени субтитри Група: V.I.P. Коментари: 173 Регистриран: 17-September 09 Град: Плевен Потребител No.: 98 918 Статус: Офлайн ![]() |
Ето такъв случай имах предвид за смесване на латиница и кирилица: JaneDow, качи ми този файл някъде (напр. tranz.it) и ми прати линк да го тествам. Ще кача след малко версия, която ще решава проблема. Просто ще се генерира файл, в който ще се заменят автоматично само OCR грешките (думите със смесен текст), а останалите няма да се пипат. Така ще отпаднат ограниченията, които съм изредил в горното мнение. После оправяш другите грешки във вече коригирания файл, като го отвориш отново в Чекъра. Вероятно ще останат не повече от 50–100, което е съвсем различно от 2'000. Ако разучиш настройките на програмата, с която рипваш субтитрите, нищо чудно да откриеш начин да я накараш да се справи по-добре с разпознаването. Например, ако има опция, с която ascii кодовете на определени разпознати букви се заменят с други ascii кодове по твой избор (българските съответствия). Edit: Версия 1.61 Следвай трите стъпки, посочени в горното мнение. В папката ще откриеш и един допълнителен файл с префикс "OCR_", който е оправеният файл. Може да го преименуваш както ти харесва и да го пуснеш отново в Чекъра, за да оправиш останалите (не OCR) грешки. Казвай, ако откриеш някакви проблеми. Не съм го тествал с такъв файл, но се надявам, че ще работи добре. Този коментар е бил редактиран от ivan4 на Dec 5 2009, 09:24 AM |
|
|
|
|
![]() ![]() ![]() |
![]() |
Олекотена версия | Час: 11th October 2025 - 10:05 AM |