DictionaryForumContacts

 russelt

link 14.07.2009 14:29 
Subject: ОФФ Как извлечь оригинал из невычищенного текста, переведенного в Традосе/Вордфасте
Коллеги, подскажите, кто знает, можно ли извлечь из невычищенного текста, переведенного в Традосе/Вордфасте, оригинал документа. Без ручного удаления перевода?
Может быть, как-то можно превратить невычищенный текст в AlignTable - было бы еще лучше?
Заранее спасибо

 tumanov

link 14.07.2009 14:58 
В традосе есть функция в меню (в ворде) - Restore source (Alt+del)
Вроде должно сработать

 tumanov

link 14.07.2009 15:01 
Попробовал сам.
Срабатывает. Но только на отдельных, открытых в Традосе сегментах.
Получается, надо идти фразу за фразой вручную вычищать.

 russelt

link 14.07.2009 15:11 
Не получается, в моем фриланс- 5.5 эта функция восстанавливает только один translation unit, а не весь текст. Проще тогда пройти весь текст, копируя источник в область перевода. (в моем случае - это 200 страниц)

 russelt

link 14.07.2009 15:15 
Прогнал текст через clean-up в wordfast на чистую ТМ. Получил ТМ. Может ее как-то можно превратить в Align table?

 tumanov

link 14.07.2009 15:16 
Тогда я бы пошел через ... жным путем
1 открыть новую пустую тм
2 очистить файл с update tm
3 выгнать из получившейся тм-ки содержание в файл с расширением тхт
4 работая с текстовым файлом, в котором содержатся все сегменты, получить из него таблицу.

 tumanov

link 14.07.2009 15:23 
Я попробовал открыть текст экспортного файла.
Получается:


15062007, 12:39:17
TUMANOV
0
Agency
Unplug the pump.
Вытащите вилку насоса из сети.


15062007, 12:39:48
TUMANOV
0
Agency
When the water cools restart.
После того как вода остынет, включите снова.


15062007, 12:40:05
TUMANOV
0
Agency
(If this does not solve the problem please consult Bestway or your dealer).
(Если это не решает проблему, проконсультируйтесь с изготовителем или продавцом изделия).

 tumanov

link 14.07.2009 15:26 
теги оказалось не видно
В начале каждого сегмента стоит TrU
В конце - /TrU

Дальше, мне кажется, уже дело техники
Можно скопировать только кириллицу и получить перевод
Можно скопировать только латиницу (порубив перед этим служебную инфу), и получить оригинал.

 tumanov

link 14.07.2009 15:41 
в тексте тмки собственно сегмент выглядит:

Seg L=EN-GB When the water cools restart.
Seg L=RU-RU После того как вода остынет, включите снова.

Эти сегЛююю поменял на плюс (Seg L=EN-GB) и минус (Seg L=RU-RU)
Затем преобразовал текст в таблицу с двумя колонками, а разделителем указал тире.

Получился результат:

 tumanov

link 14.07.2009 15:42 
imho, искомое решение.

 russelt

link 14.07.2009 15:45 
Творчески доработал Ваш совет. Преобразовал автоматом ТМ в таблицу на 11 столбцов (предварительно убрав служебную шапку), а потом удалил все лишние столбцы. Получил таблицу: слева - оригинал, справа перевод.
Большое спасибо за помощь.

 tumanov

link 14.07.2009 16:19 
Я, конечно, еще тот безумец гневный... но на ОДИННАДЦАТЪ столбцов у меня фантазии не хватил.
Это действительно классно!
:0)

 Franky

link 14.07.2009 16:28 
tumanov, извините за любопытство, но это Ваш перевод в табличке?

 russelt

link 14.07.2009 17:20 
11 столбцов мне подсказал сам Ворд, когда увидел текст, и все получилось. Уж не знаю, чем руководствовался Электронный Разум, но вышло удачно.

 S-77

link 14.07.2009 19:29 
2 russelt
Как извлечь оригинал из невычищенного текста, переведенного в Традосе/Вордфасте

Ну, по старой памяти, схема вроде такая:

1) Сохранить файл под новым именем (на всякий случай)
2) Почистить этот файл с помощью Clean Up. После чего у вас появятся, как вы, наверное, уже знаете, два файла: один .bak, другой .doc.
3) У того файла, который .bak, переименовать расширение .bak на .rtf и сохранить с этим новым расширением. Должны получить оригинал.

В Т 6.5 было вроде так. )

 'More

link 14.07.2009 19:55 
можно вот таким макросом (автор Аркадий Высоцкий).
Но он работает только с переведенным текстом (т.е. текст, "переведенный" автоматом (в WF "Translate") с пустыми сегментами перевода он не берет)
если не знаете, что с макросами делать, то проще скачать шаблон отсюда
http://rapidshare.com/files/255815909/WF_Source_text.zip.html

положить в папку MS Office -> Office11 (или какой там у вас) -> Startup, потом открыть ваш переведенный документ,
вызвать список макросов -- Alt-F8, выбрать название SourceTextOnly - нажать RUN.
ВАЖНО
1) работать с копией документа (что, возможно, изначально сделано не было)
2) поставить курсор в начало документа
сам макрос
Sub SourceTextOnly()
Selection.HomeKey Unit:=wdStory
ActiveWindow.View.ShowHiddenText = True
Do
Selection.Find.ClearFormatting
Selection.Find.Style = ActiveDocument.Styles("tw4winMark")
With Selection.Find
.Text = "<}^#"
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Segments = (Selection.Find.Execute)
If Segments Then
Selection.MoveEnd Unit:=wdSentence, Count:=1
While Selection.Characters.Last.Style <> "tw4winMark"
Selection.MoveLeft Unit:=wdCharacter, Count:=1, Extend:=wdExtend
Wend
Selection.Delete Unit:=wdCharacter, Count:=1
End If
Loop While Segments
Selection.HomeKey Unit:=wdStory
Selection.Find.ClearFormatting
Selection.Find.Style = ActiveDocument.Styles("tw4winMark")
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ""
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = True
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.ClearFormatting
Selection.Find.Font.Hidden = True
Selection.Find.Replacement.ClearFormatting
With Selection.Find.Replacement.Font
.Hidden = False
.ColorIndex = wdAuto
End With
With Selection.Find
.Text = ""
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
End Sub
По идее, должно сработать, хотя случались и глюки.

 tumanov

link 15.07.2009 8:54 
Да, перевод мой.

 

You need to be logged in to post in the forum