Brought to you by Headoff Xen

Здравейте ( Вход | Регистрация )


Collapse

> subs.sab.bz - Информация

Сериал/Прогрес Robin Hood - 01x10 от The_Assassin new7.gif
Power Book II: Ghost - 03x01 от motleycrue new7.gif
Man vs Baby - 01x04 от С.Славов new7.gif
Outlander (2024) - 07x16 от Horatio new7.gif
Spartacus: House of Ashur - 01x05 от Koen
Shef (2025) - 07x16 от Василиса
Maigret (2025) - Сезон 1 от С.Славов
Rise of the Raven - Сезон 1 от Guerrilla
The Institute (2025) - Сезон 1 от С.Славов
Untamed (2025) - Сезон 1 от The_Assassin
УебРип субтитри The Palace(2023) - Субтитри от freakazoid new7.gif
Bugonia (2025) - Субтитри от JoroNikolov new7.gif
Chainsaw Man - Reze Arc - Субтитри от С. Славов new7.gif
Tulsa King (2025) - 03x10 от JoroNikolov
The 40-Year-Old Virgin - Субтитри от JoroNikolov
Thoughts & Prayers - Субтитри от С. Славов
It: Welcome to Derry - 01x03 от JoroNikolov
Mayor of Kingstown - 04х03 от JoroNikolov
Red One (2024) - Субтитри от JoroNikolov
Country Doctor (2025) - Субтитри от С. Славов
Филм/Прогрес Carry-On (2024) - Субтитри от KikoDraka new7.gif
Sisu: Road to Revenge - Субтитри от С.Славов new7.gif
Predator: Badlands - Субтитри от С. Славов new7.gif
Frankenstein (2025) - Субтитри от ditta
The Long Walk - Субтитри от The_Assassin
The Naked Gun (2025) - Субтитри от spitfire_
Nobody 2 (2025) - Субтитри от dimi123
LEGO Disney Princess - Субтитри от Gloripeace
JW: Rebirth - Субтитри от The_Assassin
The Shadow's Edge - Прогрес: 35% от Tigermaster
36 страници V  « < 9 10 11 12 13 > »   
Reply to this topicStart new topic Thank You
> IDI Spell Checker 24.06.10, Правописен коректор
tonyy
коментар Dec 4 2009, 04:43 PM
Коментар #151




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 378
Регистриран: 17-July 09
Град: Кюстендил
Потребител No.: 96 732
Статус: Офлайн



Идеята ми дойде по време на контролно biggrin.gif . Искам да попитам дали може да се добави в проверката за думи, дали не е изпусната 1 буква, а новополучената дума съществува например ТОЙ , а е написано ТО , дали не може да се проверява. Тази опция да може да се включва и изключва smiley.gif ако се осъществи. БЛАГОДАРНОСТИ good.gif



------------------------------------
Търся преводачи за "Mutant X" -> Тема
Преводът на "Хамелеонът" продължава... -> Тема
Go to the top of the page PM
 
+Quote Post
MichaelZ
коментар Dec 4 2009, 05:05 PM
Коментар #152




-= DH team =-
Икона на група
Качени субтитри

Група: Ментори
Коментари: 395
Регистриран: 10-March 09
Град: Стара Загора
Потребител No.: 90 214
Статус: Офлайн



tonyy, предполагам, че това няма да е лесно, а за ТОЙ и ТО се съмнявам, тъй като ТО също е самостоятелна дума. smiley.gif
Soler, искам да ми пише домашнитеее! w00t2.gif

Този коментар е бил редактиран от MichaelZ на Dec 4 2009, 05:27 PM



------------------------------------
yve_sl (19:18:02 13/09/2010)
Мише, внимавай, лелиното, с тези съпруги да не се отчаяш. :D

"It's gonna be legen...wait for it...dary!"
Go to the top of the page PM
 
+Quote Post
Soler
коментар Dec 4 2009, 05:21 PM
Коментар #153




научно-популярен човек
Икона на група
Качени субтитри

Група: Ментори
Коментари: 1 019
Регистриран: 22-December 06
Потребител No.: 26
Статус: Офлайн



Направо следващата версия да пише домашни и да прави контролни. w00t2.gif



------------------------------------
Yes, London. You Know: Fish, Chips, Cup 'o Tea, Bad Food, Worse Weather, Mary Fucking Poppins... LONDON.
Go to the top of the page PM
 
+Quote Post
tonyy
коментар Dec 4 2009, 06:05 PM
Коментар #154




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 378
Регистриран: 17-July 09
Град: Кюстендил
Потребител No.: 96 732
Статус: Офлайн



MichaelZ, точно това е целта, при изпускане на буква да се получава друга съществуваща дума.



------------------------------------
Търся преводачи за "Mutant X" -> Тема
Преводът на "Хамелеонът" продължава... -> Тема
Go to the top of the page PM
 
+Quote Post
yvetted
коментар Dec 4 2009, 06:13 PM
Коментар #155




Скалолазка-парапланеристка
Икона на група
Качени субтитри

Група: Глобални модератори
Коментари: 1 903
Регистриран: 25-January 07
Град: Майнатаун
Потребител No.: 2 995
Статус: Офлайн



tonyy, ако преводачът не знае родния си език, никоя програма няма да може да му помогне. Аз съм ЗА програмите, правещи спелчек, защото при писането всеки от нас понякога разменя някоя буква със съседна, но да разчитам, че програмата ще ми оправи пунктуацията, да намира съществуващи думи при изпуснати букви - това е смешно. Всеки средноинтелигентен човек трябва да знае добре правилата за правопис и пунктуация на родния си език. Да не говорим за хора, които като нас са се наели да превеждат филми, които ще бъдат гледани от много други хора. Не бива да се разчита на програми за неща, които човек би трябвало да е научил до 12 годишната си възраст.



------------------------------------
yve_sl (21:07:31 14/06/2007)
ти що не го преведе този филм?
Best Ripper (21:08:10 14/06/2007)
аз ли требе да преведа и оправя всите филми в нета?
yve_sl (21:08:20 14/06/2007)
да
Best Ripper (21:08:32 14/06/2007)
а не може ли всите булки да оправя?
yve_sl (21:08:49 14/06/2007)
може, ама първо филмите
Go to the top of the page PM
 
+Quote Post
JaneDow
коментар Dec 4 2009, 06:14 PM
Коментар #156




-= Новак =-
*
Качени субтитри

Група: Потребител
Коментари: 4
Регистриран: 2-December 09
Потребител No.: 103 145
Статус: Офлайн



Двете тирета "--" са оправени във версия 1.59, но сега символите ">" и "<" ги третира като грешки.

Go to the top of the page PM
 
+Quote Post
tonyy
коментар Dec 4 2009, 07:33 PM
Коментар #157




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 378
Регистриран: 17-July 09
Град: Кюстендил
Потребител No.: 96 732
Статус: Офлайн



Може би не ме разрахте, но няма значение... smiley.gif



------------------------------------
Търся преводачи за "Mutant X" -> Тема
Преводът на "Хамелеонът" продължава... -> Тема
Go to the top of the page PM
 
+Quote Post
peterx
коментар Dec 4 2009, 07:38 PM
Коментар #158




-= Ветеран =-
***
Качени субтитри

Група: Потребител
Коментари: 160
Регистриран: 8-May 07
Град: Варна
Потребител No.: 27 843
Статус: Офлайн



Не исках до коментарът ми да прозвучи като опит за спор. Просто от твоето мнение останах с впечатление, че едва ли не щом искаме допълнителна функционалност по един коректор, то имаме проблеми с грамотността си smiley.gif.

Явно станахме жертва на Първия форумен закон - "Ако мнението ми може да бъде разбрано погрешно, то непременно ще бъде разбрано погрешно." rolleyes.gif

Този коментар е бил редактиран от peterx на Dec 4 2009, 10:38 PM



------------------------------------
Perfection is only a goal.
Striving for it is what we are living for.

"Love is the emptiness which binds our souls."
Go to the top of the page PM
 
+Quote Post
yvetted
коментар Dec 4 2009, 08:55 PM
Коментар #159




Скалолазка-парапланеристка
Икона на група
Качени субтитри

Група: Глобални модератори
Коментари: 1 903
Регистриран: 25-January 07
Град: Майнатаун
Потребител No.: 2 995
Статус: Офлайн



peterx, нямам намерение да влизам в безплодни и безкрайни спорове с когото и да било. Изразих собственото си мнение (имам право на такова), без да ангажирам никого с него. Всеки, който иска, да ползва каквито иска програми - те затова се правят, за да са в помощ на потребителите. Лично аз разчитам на собствената си грамотност.

Този коментар е бил редактиран от yvetted на Dec 4 2009, 09:47 PM



------------------------------------
yve_sl (21:07:31 14/06/2007)
ти що не го преведе този филм?
Best Ripper (21:08:10 14/06/2007)
аз ли требе да преведа и оправя всите филми в нета?
yve_sl (21:08:20 14/06/2007)
да
Best Ripper (21:08:32 14/06/2007)
а не може ли всите булки да оправя?
yve_sl (21:08:49 14/06/2007)
може, ама първо филмите
Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 4 2009, 11:57 PM
Коментар #160




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 4 2009, 06:21 PM) *
Двете тирета "--" са оправени във версия 1.59, но сега символите ">" и "<" ги третира като грешки.


Не са грешки. Символи като $ | @ # > < и някои други просто се броят и се показва броят им. Имай предвид, че като изключим субтитрите, в повечето други текстове тези символи обикновено са съмнителни (случайно натиснат клавиш и пр.), затова проверяващият веднага трябва да може да види какви други "гарги" съдържа текста му освен стандартните буквено-цифрени комбинации. Не е проблем да сложа опция "Режим субтитри" и при включването й да не се показва статистика за > и <, които са част от тайминга и форматирането на текста (тагове като <i> и пр.). При всички случаи показването им не пречи чак толкова.

Този коментар е бил редактиран от ivan4 на Dec 5 2009, 12:15 AM

Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 5 2009, 12:02 AM
Коментар #161




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 2 2009, 07:54 PM) *
Може да се добави функция за превръщане на код от латиница на кирилица за еднаквите символи в двете азбуки. Примерно когато се свалят субтитри на български от блу-рей, програмата за OCR не прави разлика между "а", "е", "о", "с" и т. н., но те имат различни кодове за латиница и кирилица, така че става смесване.


Готово: Версия 1.60

1. Откриват се потенциални български думи, написани изцяло с латински букви. Досега програмата засичаше само думи, в които има смесен текст, тоест едновременно латински и кирилски букви. Вече думи като "Не", "ce" и прочие, написани изцяло с латински букви, също се засичат и като предложение за корекция се предлага българския вариант и коригирането става с едно кликване в левия панел (не е нужно да пренаписвате думата ръчно). Прави се проверка дали предната и следващата дума са на латиница и ако това е така, думата не се отчита като потенциална грешка, тоест в израза "He is a boy", първата дума няма да се счита за потенциална грешка, защото Чекърът ще извършва проверката в режим "английски език".

Алгоритъмът на намиране на съответствия на отделните букви позволява известна свобода, иначе казано не е задължително буквите да изглеждат абсолютно еднакво, достатъчно е да са близки (напр. r-г, n-п, u-и) и затова в някои редки случаи може да се открият фалшиви грешки или предложенията за корекция да са доста смешни. Например ако думата "year" се срещне между две български думи, програмата би Ви предложила българския текст "уеаг" (year и някои други английски думи са в изключващ списък, тоест никога не се появяват като възможни OCR грешки). Нарочно не правя проверка дали генерираното българско предложение е валидна дума, тъй като това би ограничило засичането на някои видове грешки. Например в израза "Же Ве Це" (сам по себе си неправилен) втората дума може да е написана на латиница вместо на кирилица и въпреки че българска дума "Ве" липсва в българския словоформен списък, програмата ще Ви я предложи като корекция.

Ако дадена думи на латиница съдържа букви като t, i, s и пр., които много рядко са OCR грешки на български букви, тези думи никога не се листват като възможни OCR грешки, дори да са между две български. Срещал съм изключения, например "Ji" вместо българската "Л".

Този коментар е бил редактиран от ivan4 на Dec 6 2009, 07:39 AM

Go to the top of the page PM
 
+Quote Post
JaneDow
коментар Dec 5 2009, 12:08 AM
Коментар #162




-= Новак =-
*
Качени субтитри

Група: Потребител
Коментари: 4
Регистриран: 2-December 09
Потребител No.: 103 145
Статус: Офлайн



Цитат(ivan4)
Не са грешки. Символи като $ | @ # > < и някои други просто се броят и се показва броят им. Имай предвид, че като изключим субтитрите, в повечето други текстове тези символи обикновено са съмнителни (случайно натиснат клавиш и пр.), затова проверяващият веднага трябва да може да види какви други "гарги" съдържа текста му освен стандартните буквено-цифрени комбинации. Не е проблем да сложа опция "Режим субтитри" и при включването й да не се показва статистика за > и <, които са част от тайминга и форматирането на текста (тагове като <i> и пр.). При всички случаи показването им не пречи чак толкова.


Според мен най-удачният вариант е да има такава опция, която по подразбиране да е изключена, но да може да се запомня при включване, защото иначе стават много такива думи и символи, дето само се броят, но те отклоняват вниманието от съществените грешки.


Ето такъв случай имах предвид за смесване на латиница и кирилица:


Щракнете върху изображението
за пълен размер


Този коментар е бил редактиран от simo76 на Dec 5 2009, 12:58 AM

Go to the top of the page PM
 
+Quote Post
Zaza14
коментар Dec 5 2009, 01:38 AM
Коментар #163




-= Ветеран =-
Икона на група
Качени субтитри

Група: Глобални модератори
Коментари: 868
Регистриран: 22-December 06
Потребител No.: 35
Статус: Офлайн



Цитат(tonyy @ Dec 4 2009, 07:40 PM) *
Може би не ме разрахте, но няма значение... smiley.gif


Напротив, смятам, че всички са те разбрали правилно. Но само си представи колко думи в превода ще бъдат маркирани като потенциално незавършени и колко предложения ще изкара програмата за тях.
напр. ТО - той, но и топ, тор, тоз, ток, том, тон;
или ДА - дай, дал, дан
и доста други комбинации.
И най-прекрасната програма за автоматична проверка не може да предвиди всички човешки грешки, затова най-добре си изчитай субтитрите като ги приключиш. (доста често можеш да срещнеш грешки от типа: СЕ вместо СИ или СА). Не си представям какъв алгоритъм ще ги открие. По тази логика всяка дума от превода трябва да се анализира и подложи на проверка.

Този коментар е бил редактиран от Zaza14 на Dec 5 2009, 01:42 AM



------------------------------------
Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 5 2009, 01:49 AM
Коментар #164




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 5 2009, 12:15 AM) *
Ето такъв случай имах предвид за смесване на латиница и кирилица:


Щракнете върху изображението
за пълен размер


Този пример е уникален! rofl.gif

Я пробвай следното:
1. Отваряш Чекъра.
2. Включваш опцията "Генерирай коригиран файл".
3. Отваряш файла (чрез менюто или чрез влачене и пускане в десния панел).

Поглеждаш в папката, в която е файла и виждаш един файл с префикс "AUTO_". Това е автоматично коригираният файл. Сега лошата новина. Въпреки че в твоя случай така ще се оправят 90% от грешките (около 50% при нормални субтитри), ще има и правилни думи, които програмата ще е заместила с грешни. Също така пунктуационните грешки, ако ги има, ще останат непокътнати. Думите с главна буква също се прескачат, тъй че поне 10% от думите със смесен текст ще останат неоправени. Заради всичките тези проблеми трябва да отвориш новия "AUTO_" файл в Чекъра и ръчно да го докоригираш, изчитайки внимателно текста вдясно дума по дума. Не трябва да разчиташ само на левия панел заради потенциалните грешни замествания на автокорекцията. Тази автоматична корекция съм я писал за около час и предстои да отделя седмица-две да я направя наистина работеща. Засега опцията може да се ползва единствено за случаи като този на скрийншота.

Този коментар е бил редактиран от ivan4 на Dec 5 2009, 09:07 AM

Go to the top of the page PM
 
+Quote Post
ivan4
коментар Dec 5 2009, 08:56 AM
Коментар #165




-= Ветеран =-
***
Качени субтитри

Група: V.I.P.
Коментари: 173
Регистриран: 17-September 09
Град: Плевен
Потребител No.: 98 918
Статус: Офлайн



Цитат(JaneDow @ Dec 5 2009, 12:15 AM) *
Ето такъв случай имах предвид за смесване на латиница и кирилица:

JaneDow, качи ми този файл някъде (напр. tranz.it) и ми прати линк да го тествам. Ще кача след малко версия, която ще решава проблема. Просто ще се генерира файл, в който ще се заменят автоматично само OCR грешките (думите със смесен текст), а останалите няма да се пипат. Така ще отпаднат ограниченията, които съм изредил в горното мнение. После оправяш другите грешки във вече коригирания файл, като го отвориш отново в Чекъра. Вероятно ще останат не повече от 50–100, което е съвсем различно от 2'000.

Ако разучиш настройките на програмата, с която рипваш субтитрите, нищо чудно да откриеш начин да я накараш да се справи по-добре с разпознаването. Например, ако има опция, с която ascii кодовете на определени разпознати букви се заменят с други ascii кодове по твой избор (българските съответствия).

Edit:
Версия 1.61

Следвай трите стъпки, посочени в горното мнение. В папката ще откриеш и един допълнителен файл с префикс "OCR_", който е оправеният файл. Може да го преименуваш както ти харесва и да го пуснеш отново в Чекъра, за да оправиш останалите (не OCR) грешки. Казвай, ако откриеш някакви проблеми. Не съм го тествал с такъв файл, но се надявам, че ще работи добре.

Този коментар е бил редактиран от ivan4 на Dec 5 2009, 09:24 AM

Go to the top of the page PM
 
+Quote Post

36 страници V  « < 9 10 11 12 13 > » 
Reply to this topicStart new topic Thank You

 



- Олекотена версия Час: 1st January 2026 - 10:43 PM
Special for Translator's Heaven PHPTranslator's Converted By Translator's Heaven ©2006 InvisionCore
    Headoff Xen   Елате в .: BGtop.net :. Топ класацията на българските сайтове и гласувайте за този сайт!!!