Толик Панков
hex_laden
............ .................. ................

October 2025
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

Толик Панков [userpic]
C#. Удаление HTML-тегов из текста.

Т.е. остается только текст между тегами, например из:
<b>жирный текст</b> <a href="http://example.org">Это ссылка куда-то</a>
должно получиться
жирный текст Это ссылка куда-то

Регулярное выражение для HTML-тега


По счастью, оно совсем простое:

<[^>]+>

Пример


Не забываем подключить соответствующее пространство имен:
using System.Text.RegularExpressions;
//...
string htmlText = "<html><head><title>tolik-punkoff.com</title></head> <body>Welcome to Tolik Punkoff blog!</body></html>";
OutputText = Regex.Replace(htmlText, "<[^>]+>", string.Empty);

//Содержимое OutputText:
//tolik-punkoff.com Welcome to Tolik Punkoff blog!


Примечание: В примере между фразами пробелы, потому что есть пробелы между тегами. Функция никаких пробелов сама по себе не вставляет!

Это репост с сайта http://tolik-punkoff.com
Оригинал: http://tolik-punkoff.com/2019/10/14/c-udalenie-html-tegov-iz-teksta/

Tags: ,
Comments

Что за Драконья Книга? Дай ссылку, коли нивпадлу.

Блин, а как ты в тему подошел! Мне как раз в новом проекте будет нужен "мини-язык", я наверное просто жестко забью команды в БД и сам "язык" сделаю, как выборку из БД но все равно спасибо.

На полноценный парсер меня не хватит, тем более в сроки.

нет там ничего сложного. час работы. штудируй литературу, она очень хорошая литература. внимательно прочитаешь — все проблемы отпадут.

Ну если найду в хорошем переводе то да. А так я уже примерно прикинул, чтоб не парзить плейнтекст - взять и команды (их немного) забить в качестве 1 поля БД, параметры - во втором, вот и весь пирог с котятами.

(Anonymous)

>если найду в хорошем переводе

Дичайше проиграл! "Гений" хуйлашка до сих пор не смог осилить простенький английский. Это пиздец, ор выше гор сука )))))

Не гений. Но сложные вещи действительно не могу. Не горжусь, но и не парюсь по сему поводу. Даже в закон Ома и то не все могут.

и да: это значит ровно то, что я написал: там нет ничего сложного. любая известная технология простая. сложности от того, что во-первых, люди убеждают себя, что нечто сложно, а во-вторых, часто изучают в неправильном порядке, не имея базового понимания, но пытаясь запрыгнуть на продвинутое. главы Драконьей Книги про парзинг достаточны, просто не надо ничего пропускать, и не надо бежать дальше, пока не понял то, что написано до этого. Драконья Книга — именно учебник.

Вот если учебник - тогда лучше медленно читать и делать примеры. Тогда будет просто, может и поумнею. А текущий проект пока сделаю не на парсинге, а на фиксированных командах, занесенных в БД. Парсинг, на самом деле, делает примерно тоже самое, но БД там скрытая, как я понимаю.