Brought to you by Headoff Xen

Здравейте ( Вход | Регистрация )


Collapse

> subs.sab.bz - Информация

Сериал/Прогрес Peacemaker (2025) - 02x08 от spitfire_ new7.gif
Untamed (2025) - 01x05 от The_Assassin new7.gif
Shef (2025) - 07x13 от Василиса
Rise of the Raven - 01x06 от Guerrilla
Power Book II: Ghost - Сезон 2 от motleycrue
Wednesday (2025) - 02x08 от Tigermaster
Dexter: Resurrection - Season 1 от The_Assassin
Eyes of Wakanda (2025) - Сезон 1 от С. Славов
Ransom Canyon - 01x08 от JoroNikolov
Dept. Q (2025) - 01x09 от The_Assassin
УебРип субтитри The Conjuring: Last Rites - Субтитри от sub.Trader new7.gif
Tulsa King (2025) - 03x03 от JoroNikolov new7.gif
Freakier Friday (2025) - Субтитри от sub.Trader
Outlander: Blood of My Blood - 01x09 от JoroNikolov
TWD: Dead City - Сезон 2 от JoroNikolov
Escape at Dannemora - Сезон 1 от JoroNikolov
The Fantastic 4: First Steps - Субтитри от sub.Trader
The Loudest Voice - Сезон 1 от JoroNikolov
Umbre (2014) - Сезон 1 от Fastuka
Война и музика (2025) - Субтитри от Fastuka
Филм/Прогрес The Naked Gun (2025) - Субтитри от spitfire_ new7.gif
Nobody 2 (2025) - Субтитри от dimi123 new7.gif
LEGO Disney Princess - Субтитри от Gloripeace
Jurassic World: Rebirth - Субтитри от The_Assassin
M3GAN 2.0 (2025) - Субтитри от Слав Славов
Fear Street: Prom Queen - Субтитри от KikoDraka
Don't Move (2024) - Субтитри от KikoDraka
Master Z: The Ip Man Legacy - Субтитри от Tigermaster
The Legend of Ochi (2025) - Субтитри от Слав Славов
Uglies (2024) - Субтитри от KikoDraka
36 страници V  « < 9 10 11 12 13 > »   
Reply to this topicStart new topic Thank You
> IDI Spell Checker 24.06.10, Правописен коректор
tonyy
коментар Dec 4 2009, 04:43 PM
Коментар #151




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 378
Регистриран: 17-July 09
Град: Кюстендил
Потребител No.: 96 732
Статус: Офлайн



Идеята ми дойде по време на контролно biggrin.gif . Искам да попитам дали може да се добави в проверката за думи, дали не е изпусната 1 буква, а новополучената дума съществува например ТОЙ , а е написано ТО , дали не може да се проверява. Тази опция да може да се включва и изключва smiley.gif ако се осъществи. БЛАГОДАРНОСТИ good.gif



------------------------------------
Търся преводачи за "Mutant X" -> Тема
Преводът на "Хамелеонът" продължава... -> Тема
Go to the top of the page PM
 
+Quote Post
MichaelZ
коментар Dec 4 2009, 05:05 PM
Коментар #152




-= DH team =-
Икона на група
Качени субтитри

Група: Ментори
Коментари: 395
Регистриран: 10-March 09
Град: Стара Загора
Потребител No.: 90 214
Статус: Офлайн



tonyy, предполагам, че това няма да е лесно, а за ТОЙ и ТО се съмнявам, тъй като ТО също е самостоятелна дума. smiley.gif
Soler, искам да ми пише домашнитеее! w00t2.gif

Този коментар е бил редактиран от MichaelZ на Dec 4 2009, 05:27 PM



------------------------------------
yve_sl (19:18:02 13/09/2010)
Мише, внимавай, лелиното, с тези съпруги да не се отчаяш. :D

"It's gonna be legen...wait for it...dary!"
Go to the top of the page PM
 
+Quote Post
Soler
коментар Dec 4 2009, 05:21 PM
Коментар #153




научно-популярен човек
Икона на група
Качени субтитри

Група: Ментори
Коментари: 1 019
Регистриран: 22-December 06
Потребител No.: 26
Статус: Офлайн



Направо следващата версия да пише домашни и да прави контролни. w00t2.gif



------------------------------------
Yes, London. You Know: Fish, Chips, Cup 'o Tea, Bad Food, Worse Weather, Mary Fucking Poppins... LONDON.
Go to the top of the page PM
 
+Quote Post
tonyy
коментар Dec 4 2009, 06:05 PM
Коментар #154




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 378
Регистриран: 17-July 09
Град: Кюстендил
Потребител No.: 96 732
Статус: Офлайн



MichaelZ, точно това е целта, при изпускане на буква да се получава друга съществуваща дума.



------------------------------------
Търся преводачи за "Mutant X" -> Тема
Преводът на "Хамелеонът" продължава... -> Тема
Go to the top of the page PM
 
+Quote Post
yvetted
коментар Dec 4 2009, 06:13 PM
Коментар #155




Скалолазка-парапланеристка
Икона на група
Качени субтитри

Група: Глобални модератори
Коментари: 1 903
Регистриран: 25-January 07
Град: Майнатаун
Потребител No.: 2 995
Статус: Офлайн



tonyy, ако преводачът не знае родния си език, никоя програма няма да може да му помогне. Аз съм ЗА програмите, правещи спелчек, защото при писането всеки от нас понякога разменя някоя буква със съседна, но да разчитам, че програмата ще ми оправи пунктуацията, да намира съществуващи думи при изпуснати букви - това е смешно. Всеки средноинтелигентен човек трябва да знае добре правилата за правопис и пунктуация на родния си език. Да не говорим за хора, които като нас са се наели да превеждат филми, които ще бъдат гледани от много други хора. Не бива да се разчита на програми за неща, които човек би трябвало да е научил до 12 годишната си възраст.



------------------------------------
yve_sl (21:07:31 14/06/2007)
ти що не го преведе този филм?
Best Ripper (21:08:10 14/06/2007)
аз ли требе да преведа и оправя всите филми в нета?
yve_sl (21:08:20 14/06/2007)
да
Best Ripper (21:08:32 14/06/2007)
а не може ли всите булки да оправя?
yve_sl (21:08:49 14/06/2007)
може, ама първо филмите
Go to the top of the page PM
 
+Quote Post
JaneDow
коментар Dec 4 2009, 06:14 PM
Коментар #156




-= Новак =-
*
Качени субтитри

Група: Потребител
Коментари: 4
Регистриран: 2-December 09
Потребител No.: 103 145
Статус: Офлайн



Двете тирета "--" са оправени във версия 1.59, но сега символите ">" и "<" ги третира като грешки.

Go to the top of the page PM
 
+Quote Post
tonyy
коментар Dec 4 2009, 07:33 PM
Коментар #157




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 378
Регистриран: 17-July 09
Град: Кюстендил
Потребител No.: 96 732
Статус: Офлайн



Може би не ме разрахте, но няма значение... smiley.gif



------------------------------------
Търся преводачи за "Mutant X" -> Тема
Преводът на "Хамелеонът" продължава... -> Тема
Go to the top of the page PM
 
+Quote Post
peterx
коментар Dec 4 2009, 07:38 PM
Коментар #158




-= Ветеран =-
***
Качени субтитри

Група: Потребител
Коментари: 160
Регистриран: 8-May 07
Град: Варна
Потребител No.: 27 843
Статус: Офлайн



Не исках до коментарът ми да прозвучи като опит за спор. Просто от твоето мнение останах с впечатление, че едва ли не щом искаме допълнителна функционалност по един коректор, то имаме проблеми с грамотността си smiley.gif.

Явно станахме жертва на Първия форумен закон - "Ако мнението ми може да бъде разбрано погрешно, то непременно ще бъде разбрано погрешно." rolleyes.gif

Този коментар е бил редактиран от peterx на Dec 4 2009, 10:38 PM



------------------------------------
Perfection is only a goal.
Striving for it is what we are living for.

"Love is the emptiness which binds our souls."
Go to the top of the page PM
 
+Quote Post
yvetted
коментар Dec 4 2009, 08:55 PM
Коментар #159




Скалолазка-парапланеристка
Икона на група
Качени субтитри

Група: Глобални модератори
Коментари: 1 903
Регистриран: 25-January 07
Град: Майнатаун
Потребител No.: 2 995
Статус: Офлайн



peterx, нямам намерение да влизам в безплодни и безкрайни спорове с когото и да било. Изразих собственото си мнение (имам право на такова), без да ангажирам никого с него. Всеки, който иска, да ползва каквито иска програми - те затова се правят, за да са в помощ на потребителите. Лично аз разчитам на собствената си грамотност.

Този коментар е бил редактиран от yvetted на Dec 4 2009, 09:47 PM



------------------------------------
yve_sl (21:07:31 14/06/2007)
ти що не го преведе този филм?
Best Ripper (21:08:10 14/06/2007)
аз ли требе да преведа и оправя всите филми в нета?
yve_sl (21:08:20 14/06/2007)
да
Best Ripper (21:08:32 14/06/2007)
а не може ли всите булки да оправя?
yve_sl (21:08:49 14/06/2007)
може, ама първо филмите
Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 4 2009, 11:57 PM
Коментар #160




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 4 2009, 06:21 PM) *
Двете тирета "--" са оправени във версия 1.59, но сега символите ">" и "<" ги третира като грешки.


Не са грешки. Символи като $ | @ # > < и някои други просто се броят и се показва броят им. Имай предвид, че като изключим субтитрите, в повечето други текстове тези символи обикновено са съмнителни (случайно натиснат клавиш и пр.), затова проверяващият веднага трябва да може да види какви други "гарги" съдържа текста му освен стандартните буквено-цифрени комбинации. Не е проблем да сложа опция "Режим субтитри" и при включването й да не се показва статистика за > и <, които са част от тайминга и форматирането на текста (тагове като <i> и пр.). При всички случаи показването им не пречи чак толкова.

Този коментар е бил редактиран от ivan4 на Dec 5 2009, 12:15 AM

Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 5 2009, 12:02 AM
Коментар #161




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 2 2009, 07:54 PM) *
Може да се добави функция за превръщане на код от латиница на кирилица за еднаквите символи в двете азбуки. Примерно когато се свалят субтитри на български от блу-рей, програмата за OCR не прави разлика между "а", "е", "о", "с" и т. н., но те имат различни кодове за латиница и кирилица, така че става смесване.


Готово: Версия 1.60

1. Откриват се потенциални български думи, написани изцяло с латински букви. Досега програмата засичаше само думи, в които има смесен текст, тоест едновременно латински и кирилски букви. Вече думи като "Не", "ce" и прочие, написани изцяло с латински букви, също се засичат и като предложение за корекция се предлага българския вариант и коригирането става с едно кликване в левия панел (не е нужно да пренаписвате думата ръчно). Прави се проверка дали предната и следващата дума са на латиница и ако това е така, думата не се отчита като потенциална грешка, тоест в израза "He is a boy", първата дума няма да се счита за потенциална грешка, защото Чекърът ще извършва проверката в режим "английски език".

Алгоритъмът на намиране на съответствия на отделните букви позволява известна свобода, иначе казано не е задължително буквите да изглеждат абсолютно еднакво, достатъчно е да са близки (напр. r-г, n-п, u-и) и затова в някои редки случаи може да се открият фалшиви грешки или предложенията за корекция да са доста смешни. Например ако думата "year" се срещне между две български думи, програмата би Ви предложила българския текст "уеаг" (year и някои други английски думи са в изключващ списък, тоест никога не се появяват като възможни OCR грешки). Нарочно не правя проверка дали генерираното българско предложение е валидна дума, тъй като това би ограничило засичането на някои видове грешки. Например в израза "Же Ве Це" (сам по себе си неправилен) втората дума може да е написана на латиница вместо на кирилица и въпреки че българска дума "Ве" липсва в българския словоформен списък, програмата ще Ви я предложи като корекция.

Ако дадена думи на латиница съдържа букви като t, i, s и пр., които много рядко са OCR грешки на български букви, тези думи никога не се листват като възможни OCR грешки, дори да са между две български. Срещал съм изключения, например "Ji" вместо българската "Л".

Този коментар е бил редактиран от ivan4 на Dec 6 2009, 07:39 AM

Go to the top of the page PM
 
+Quote Post
JaneDow
коментар Dec 5 2009, 12:08 AM
Коментар #162




-= Новак =-
*
Качени субтитри

Група: Потребител
Коментари: 4
Регистриран: 2-December 09
Потребител No.: 103 145
Статус: Офлайн



Цитат(ivan4)
Не са грешки. Символи като $ | @ # > < и някои други просто се броят и се показва броят им. Имай предвид, че като изключим субтитрите, в повечето други текстове тези символи обикновено са съмнителни (случайно натиснат клавиш и пр.), затова проверяващият веднага трябва да може да види какви други "гарги" съдържа текста му освен стандартните буквено-цифрени комбинации. Не е проблем да сложа опция "Режим субтитри" и при включването й да не се показва статистика за > и <, които са част от тайминга и форматирането на текста (тагове като <i> и пр.). При всички случаи показването им не пречи чак толкова.


Според мен най-удачният вариант е да има такава опция, която по подразбиране да е изключена, но да може да се запомня при включване, защото иначе стават много такива думи и символи, дето само се броят, но те отклоняват вниманието от съществените грешки.


Ето такъв случай имах предвид за смесване на латиница и кирилица:


Щракнете върху изображението
за пълен размер


Този коментар е бил редактиран от simo76 на Dec 5 2009, 12:58 AM

Go to the top of the page PM
 
+Quote Post
Zaza14
коментар Dec 5 2009, 01:38 AM
Коментар #163




-= Ветеран =-
Икона на група
Качени субтитри

Група: Глобални модератори
Коментари: 868
Регистриран: 22-December 06
Потребител No.: 35
Статус: Офлайн



Цитат(tonyy @ Dec 4 2009, 07:40 PM) *
Може би не ме разрахте, но няма значение... smiley.gif


Напротив, смятам, че всички са те разбрали правилно. Но само си представи колко думи в превода ще бъдат маркирани като потенциално незавършени и колко предложения ще изкара програмата за тях.
напр. ТО - той, но и топ, тор, тоз, ток, том, тон;
или ДА - дай, дал, дан
и доста други комбинации.
И най-прекрасната програма за автоматична проверка не може да предвиди всички човешки грешки, затова най-добре си изчитай субтитрите като ги приключиш. (доста често можеш да срещнеш грешки от типа: СЕ вместо СИ или СА). Не си представям какъв алгоритъм ще ги открие. По тази логика всяка дума от превода трябва да се анализира и подложи на проверка.

Този коментар е бил редактиран от Zaza14 на Dec 5 2009, 01:42 AM



------------------------------------
Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 5 2009, 01:49 AM
Коментар #164




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 5 2009, 12:15 AM) *
Ето такъв случай имах предвид за смесване на латиница и кирилица:


Щракнете върху изображението
за пълен размер


Този пример е уникален! rofl.gif

Я пробвай следното:
1. Отваряш Чекъра.
2. Включваш опцията "Генерирай коригиран файл".
3. Отваряш файла (чрез менюто или чрез влачене и пускане в десния панел).

Поглеждаш в папката, в която е файла и виждаш един файл с префикс "AUTO_". Това е автоматично коригираният файл. Сега лошата новина. Въпреки че в твоя случай така ще се оправят 90% от грешките (около 50% при нормални субтитри), ще има и правилни думи, които програмата ще е заместила с грешни. Също така пунктуационните грешки, ако ги има, ще останат непокътнати. Думите с главна буква също се прескачат, тъй че поне 10% от думите със смесен текст ще останат неоправени. Заради всичките тези проблеми трябва да отвориш новия "AUTO_" файл в Чекъра и ръчно да го докоригираш, изчитайки внимателно текста вдясно дума по дума. Не трябва да разчиташ само на левия панел заради потенциалните грешни замествания на автокорекцията. Тази автоматична корекция съм я писал за около час и предстои да отделя седмица-две да я направя наистина работеща. Засега опцията може да се ползва единствено за случаи като този на скрийншота.

Този коментар е бил редактиран от ivan4 на Dec 5 2009, 09:07 AM

Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 5 2009, 08:56 AM
Коментар #165




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 5 2009, 12:15 AM) *
Ето такъв случай имах предвид за смесване на латиница и кирилица:

JaneDow, качи ми този файл някъде (напр. tranz.it) и ми прати линк да го тествам. Ще кача след малко версия, която ще решава проблема. Просто ще се генерира файл, в който ще се заменят автоматично само OCR грешките (думите със смесен текст), а останалите няма да се пипат. Така ще отпаднат ограниченията, които съм изредил в горното мнение. После оправяш другите грешки във вече коригирания файл, като го отвориш отново в Чекъра. Вероятно ще останат не повече от 50–100, което е съвсем различно от 2'000.

Ако разучиш настройките на програмата, с която рипваш субтитрите, нищо чудно да откриеш начин да я накараш да се справи по-добре с разпознаването. Например, ако има опция, с която ascii кодовете на определени разпознати букви се заменят с други ascii кодове по твой избор (българските съответствия).

Edit:
Версия 1.61

Следвай трите стъпки, посочени в горното мнение. В папката ще откриеш и един допълнителен файл с префикс "OCR_", който е оправеният файл. Може да го преименуваш както ти харесва и да го пуснеш отново в Чекъра, за да оправиш останалите (не OCR) грешки. Казвай, ако откриеш някакви проблеми. Не съм го тествал с такъв файл, но се надявам, че ще работи добре.

Този коментар е бил редактиран от ivan4 на Dec 5 2009, 09:24 AM

Go to the top of the page PM
 
+Quote Post

36 страници V  « < 9 10 11 12 13 > » 
Reply to this topicStart new topic Thank You

 



- Олекотена версия Час: 11th October 2025 - 10:05 AM
Special for Translator's Heaven PHPTranslator's Converted By Translator's Heaven ©2006 InvisionCore
    Headoff Xen   Елате в .: BGtop.net :. Топ класацията на българските сайтове и гласувайте за този сайт!!!