Категория: Компьютеры

Заметки о программировании и на околокомпьютерные темы

Вложенные категории: Игры, Delphi

type и class

В Delphi можно написать:

type HexString = string;

Так мы отметим специальный тип строк, который хранит в себе hex. Но для компилятора они ничем не отличаются от обычных. Вот это скомпилируется нормально:

var a: HexString;
  b: string;
begin
  a := b;
end;

Что, если мы не хотим разрешать такое копирование? (А обычно мы должны не хотеть! Разные по смыслу вещи нельзя присваивать, это опасно). Компилятор можно попросить создать “независимый тип”:

type HexString = type string;

Теперь строку типа HexString нельзя присвоить строке типа string, и наоборот.

Похожий приём работает с классами, только чуть иначе.

type
  HexStringList = TStringList; //можно присваивать HexStringList -> StringList и обратно!
  HexStringList = class(TStringList); //можно присваивать только HexStringList -> StringList, но не обратно!

Классы, в отличие от простых типов, поддерживают наследование. Более “частный” класс можно положить в переменную более общего, но не наоборот. Если мы объявляем тип без “class“, то мы просто создаём для него другое имя: оба типа на самом деле одно и то же. А с помощью “class(TStringList)” мы говорим компилятору “HexStringList – это частный случай StringList, он от него наследует”.

Но что, если мы напишем так?

type HexStringList = type TStringList;

Или так?

type HexStringList = type class(TStringList);

Ответы на это в следующий раз!

Don’t write what you don’t need

Опять программирование. Когда пишешь одну функцию, часто подмывает заодно написать с десяток – и обратное преобразование, и с параметром, и Анси-версию, чтоб уж сразу была библиотечка всего такого на потом. Программисты обожают библиотечки. У каждого программиста своя работа со строками и своё буферизованное чтение в запасах.

Но понемногу я пришёл к выводу, что это вредно.

Даже не тем, что тратится лишнее время. Функции могут однажды пригодиться, и потом, это мелочи, тут нечто гораздо более страшное.

Написав ненужный код, вы его не тестируете. Его не на чем тестировать: в текущем проекте он нигде не используется, ведь если бы он использовался, то это был бы нужный код! И если вы серьёзно хотите, чтобы я поверил, что вы оторвётесь от работы над проектом и напишете юнит-тест для каждой функции, которые вам сейчас толком и не нужны, то тренируйтесь врать. Я – точно не напишу. Мне лень.

В результате получается код, который написан, лежит вперемешку с правильным, похож на правильный, но содержит ошибки.

Возможно, вы узнаете об этом через год, отлаживая загадочные баги в новой программе, использующей старую, давно проверенную библиотеку. Наткнётесь на ошибку в коде функции, удивитесь: “Да как оно вообще работало?” А оно и не работало.
Даже если вы не тестируете новые функции специально, нужные функции сами собой проверяются в ходе работы программы. Пусть это не полноценное тестирование, но большинство путей кода всё-таки оказываются покрыты. Дополнительные же функции не вызывались ни разу, поэтому баг может быть где угодно, даже на самом виду.

Но мало того, когда вы захотите исправить ошибку, вам вдруг станет страшно. Вы подумаете: “А что, если?..”

Что, если эта функция кем-то используется? Ведь неспроста она оказалась в библиотеке. Никто не будет писать функции просто так. Значит, какой-то из проектов вызывает эту функцию и притом работает.
Если вы её сейчас исправите – не сломается ли он?
Да, у вас тут индексация с нуля, а не с единицы, как сказано в комментарии. Вызывая функцию правильно, получить хороший результат невозможно. Значит, кто-то вызывает её неправильно, по ошибке передаёт как раз нужный ошибочный индекс. Если вы функцию почините, тот проект сломается.
Неизвестно, какой. Неизвестно, когда и где. Но что сломается – это почти наверняка.

Нет такого программиста, которому нравилось бы наугад портить свои проекты. И вы откатываете правки и оставляете функцию сломанной, а рядом пишете новую, functionName2(). На этот раз правильную.
И заодно ещё что-нибудь.

Wakan

Wakan 1.80.8 переводит 1 мегабайт текста за 4 секунды!
Стабильная версия, 1.67, на него же тратила 26.5 минут.

Ещё он понимает Аозора-Руби. Можно вставлять текст в таком: 大人《おとな》びた雰囲気 – формате, и вот эти скобочки превратятся в подпись над 大人. А ещё Вакан может сохранять свой собственный автоматический перевод в виде руби! Это значит, что можно загрузить книжку, нажать “Auto-Translate”, и Вакан расставит чтение всем тем словам, которые вы ещё не выучили. И эту книжку потом можно читать в любой из тысяч поддерживающих руби читалок, и слова будут подписаны!

Консты нереально круты

Да, я понимаю, что тут никто не пишет на дельфи, но раз уж я иногда что-то пишу о ней, то позвольте мне.

В дельфи есть элемент языка, которым все пренебрегают. Очень крутой. Это атрибут входного параметра const.
Вместо:
function IsStringAbrakadabra(s:string): boolean
Получится:
function IsStringAbrakadabra(const s:string): boolean

Зачем?
Строки в Дельфи ведут учёт ссылок. Каждое присваивание увеличивает счётчик на 1. Каждое зануление – уменьшает его. Поэтому любая функция, которая получает строки, преобразуется компилятором в следующую:

UStrLAsg(s); //увеличить счётчик ссылок
try
  //сама функция
finally
  UStrLClr(s); //уменьшить счётчик ссылок
end;

Два лишних вызова! И фрейм try..finally (это очень дорогая конструкция). Эта обёртка легко может тратить больше времени, чем сама ваша функция! Скомпилите и посмотрите в ассемблер – инлайнить такую дуру тоже пропадает всякая выгода.

На помощь спешит модификатор const! Он говорит компилятору, что вы клянётесь героиней любимого мультика не трогать полученной строки. Тогда можно учёт ссылок не вести, и фрейм try..finally тоже не нужен. Вместо 60 ассемблерных инструкций ваша функция внезапно компилируется в шесть!

Но это ещё не всё.
Мало добавлять const к строковым параметрам. Строки могут передаваться неявно. Функция, которая получает структуру со строкой внутри, тоже требует учёта ссылок и фрейма try..finally. Даже хуже: вместо прямолинейного UStrLAsg будет вызван AddRefRecord, который с помощью некоего подобия рефлекшна изучает вашу структуру и решает, каким полям нужен какой учёт ссылок. И так в каждой функции!
Дельфи не глупая, и если структуре совсем не нужен учёт ссылок, она поймёт это при компиляции, и фрейм не вставит. Но когда хоть одно поле требует учёта, вы получите пенальти в размере полного разбора всей структуры дважды.

Поэтому ставьте const везде, где можно. Ставьте const всему, что передаёте на копирование во всевозможные “SetSomething” или “InitSomething”. В крайнем случае он будет просто подсказкой читающему код.

Ещё очень важная информация: отключайте “String format checking” в настройках компиляции. Всегда. Сразу же. Эту опцию следовало бы назвать “замедлить в три раза все операции со строками, для того, чтобы спрятать от вас чудовищные баги в вашем коде”.

HDTV

Помните, год назад я говорил, что блюреи не нужны? Ну так вот, купив телевизор, который их проигрывает, я, разумеется, поменял мнение на противоположное: теперь я объективно могу заявить, что блюреи – лучшее из всего, что случалось с человечеством после предыдущей случившейся с ним не менее хорошей вещи.

Теперь-то мне стало понятно, зачем мыII-Subs выпускали Бакемоногатри в BD-формате. Это затем, чтоб я его через пару лет на телевизоре посмотрел. От качества перехватывает дыхание. (Ну или в комнате наконец надо проветрить)

Но лучше я расскажу о телевизоре – возможно, кого-то заинтересует.

Оказывается, современные телевизоры умеют подключаться к рутеру по Wi-Fi и проигрывать видео с компьютеров напрямую. Не нужно тянуть никакие провода, кроме обычного электричества. И понимают они почти все популярные форматы и кодеки, включая матрёшку. Только новомодное десятибитное видео на телевизоре пока проигрывается с подтёками.
Можно поставить телевизор, воткнуть в розетку и смотреть по воздуху всё, что лежит у вас на компьютере!
Да если б я знал раньше, я бы из больницы в магазин побежал.

Конечно, на деле всё немного неудобней. Просто расшарить файлы нельзя: нужно ставить программу, сервер медиа-вещания, и объяснять ей, где у вас что лежит. Программа пожует-пожуёт ваши файлы, и они станут доступны на телевизоре.

Хорошие новости: таких программ много. Не обязательно использовать глючную от Samsungвашего корейского производителя телевизора, можно скачать бесплатную открытую и более надёжную Serviio, например (к ней ещё есть плагины). Ну или любую другую.
Хорошие новости: Serviio и некоторые другие программы умеют перекодировать на лету. Если телевизор всё-таки не поддерживает формат файла, так его можно посмотреть.

Плохие новости: безупречных медиа-вещателей нет. Все они глючны, какие больше, какие меньше! Один раз настроить и забыть не выйдет; привыкайте, что с каждым новым сериалом или фильмом придётся минут 15 возиться, перезагружая сервер, скармливая ему файлы, гладя по головке, упрашивая проиндексировать… Ну почему ты не индексируешь? Ну что тебе не нравится? Ах не под тем аккаунтом ты запущен? Ах под администратором тебе не нравится? Запустить твою службу под обычным пользователем? Конечно, запущу, ты только не плачь.
Привыкайте, что телевизор будет файл за файлом отказываться проигрывать, упрямо глядя на вас, как баран, и талдыча: “Ничего не знаю, формат пока не поддерживается”. Что перекодированный файл он не сможет скроллить. Вот так! Смотрите от начала и до конца. Что наткнувшись на восьмую серию Нисемоногатари, медиа-сервер сойдёт с ума, и все дальнейшие папки на телевизоре будут одинаково называться “Ore no imouto”.

Но зато вы можете посмотреть Бакемоногатари в офигенном разрешении 1080p. Это правда очень красиво.

P.S. Плохие новости: медиа-серверы не очень любят внешние сабы, только встроенные. И у встроенных теряется разметка.
Хорошие новости: скоро Новый год.

P.P.S. Забыл сказать, что на телевизор можно устанавливать приложения для работы с интернетом. Например, можно смотреть ютюб. Только это неудобно.

Это просто праздник какой-то

if AnsiCompareStr(uppercase(value),uppercase(s))<0 then r:=c else
if AnsiCompareStr(uppercase(value),uppercase(s))>0 then l:=c+1 else
if AnsiCompareStr(uppercase(value),uppercase(s))=0 then r:=c;

Мало того, что “<=” разбито на “<” и “=” с одинаковым исходом, так тут вообще достаточно одной проверки:

if AnsiCompareStr(uppercase(value),uppercase(s))<=0 then r:=c else l:=c+1;

UPD. Я в этот пост буду складывать все такие примеры!

if (doall) then
begin
  if not doall then
  begin

Трудно быть богом

Пока рефакторю чужой код, постоянно ловлю себя на мысли из Стругацких:
Мы здесь не для того, чтобы их спасать.

Всем строкам кода не поможешь, их слишком много, а наши силы ограничены! Закрой глаза на это чудовищное условие для while из 15 строк. Отвернись, когда видишь, как одна и та же проверка снова и снова вызывается в цикле. Занимайся своим делом: переписывай самые медленные места, а остальное оставь как есть. Тут просто эпоха такая.

Оптимизация

Ну вот, после моих переделок текст, который раньше переводился в Вакане минуту 10 секунд, переводится за 5 секунд.
Хо-хо!

Полюбуйтесь, что для этого пришлось нагородить:
{$IFDEF INTEGER_HELL}
{
Note on integer comparison optimization:
We're not checking if roma_t[i].hiragana has one or two 4-chars.
It's okay. If it has one, then roma_t[i].hiragana[5]==#00, and it wouldn't match
to any 4-char hex combination.
It also won't AV because the memory's dword aligned and hiragana[5] is accessible already.
}
if ((pinteger(ps)^=pinteger(roma_t[i].hiragana_ptr)^)
and (pinteger(integer(ps)+4)^=pinteger(integer(roma_t[i].hiragana_ptr)+4)^))
or ((pinteger(ps)^=pinteger(roma_t[i].katakana_ptr)^)
and (pinteger(integer(ps)+4)^=pinteger(integer(roma_t[i].katakana_ptr)+4)^)) then begin
{$ELSE}
if FcharCmp(ps, roma_t[i].hiragana_ptr, 2)
or FcharCmp(ps, roma_t[i].katakana_ptr, 2) then begin
{$ENDIF}

Это я здесь сравниваю строки из 4-символов (4 байта на хекс-код).

Капусту в студию

Хотите посмотреть на код, от которого хочется плакать кровавыми слезами? Исходный код Вакана… Я когда-то его выпросил у автора в рассчёте исправить баги.
Только посмотрите на TfUser.DicSearch… TfUser.RenderText… Да на что угодно! Эти простыни непрокомментированного кода! Эти сотни переменных с именами s, i, w, f, buf, ws, wss, wcs, l, ls, dp, tp, jtt, dot, s2, s3! Эти затычки для экспшнов повсюду, где (автор удивлённо пожимает плечами) почему-то случаются эксепшны… Эти названия компонентов Label1-Label123! Это ДНК. Никому не ясно, как в нём работает, что в нём работает, и зачем оно в нём работает.

Функция перебирает строку по символу (на самом деле, по 4 символа):
if i<=9 then se.Add(inttostr(9-j)+'0'+inttostr(i)+'F'+copy(s,1,i*4)) else se.Add(inttostr(9-j)+inttostr(i)+'F'+copy(s,1,i*4));
Если номер символа меньше девяти, то мы добавляем куда-токакую-то хрень с нулём в середине. Если больше девяти, то без нуля. Что? Почему?! Почему девять? Что это за нули? Что это за F? Куда мы их добавляем? В чём смысл жизни?! Есть ли бог?! Почему мы сравниваем с девятью i, а вычитаем из девяти j?! Все эти вопросы оставлены без ответа.

На всякий случай скажу, что к автору Вакана претензий нет – он не обязан был публиковать код, и когда я просил его открыть, то сказал, чтоб он не стеснялся кривого кода, я разберусь; этим сейчас и занимаюсь. Но того, что код кошмарный, это не меняет.

RSS

Пожалуйста, пожалуйста, пожалуйста, я вас очень убедительно прошу, красивыми чёрными буквами. Когда делаете RSS к своему блогу, экспортируйте ПОЛНЫЕ ЗАПИСИ. Не начало и “читать дальше”, не половину, не две трети – целиком.

Зачем?

А потому, что сколько раз уже какой-нибудь блог поплавает-поплавает, да и пойдёт кормить рыб. А у меня потом в читалке фидов остаётся половина офигенного поста. И ещё одна половина офигенного поста. Но другого. И ещё много разных частей офигенных постов. И вот я сижу и утешаю себя, что в принципе дочитывать необязательно, я и так помню – там была такая же офигенная половина, как первая, только вторая.

То есть, вообще-то говоря, не закрывайте свои блоги блин! Что вам, сложно хостинг раз в год оплатить? Триста рублей? Даже если вы уже расстались с юношескими мечтами однажды написать такой пост, что интернет содрогнётся. (Или уже написали такой). Но во всяком случае, экспортируйте в RSS посты целиком… даже если там спойлеры или куча текста.