C++ Как получить значение из этой строки

Как мне получить значение в этом фрагменте html-кода

<select id="convert-from" name="currency-1">
  <option value='EUR'>Euro (EUR)</option>
  <option value='GBP'>British Pound (GBP)</option>
  <option value='USD'>United States Dollar (USD)</option>
  <option value='AUD'>Australian Dollar (AUD)</option>
  <option value='CAD'>Canadian Dollar (CAD)</option>
  <option value='CHF'>Swiss Franc (CHF)</option>
  <option value='CNY'>Chinese Yuan (CNY)</option>
</select>

Мне нужно значение, например, EURO (EUR), британский фунт (GBP), и вывести его в файл с именем currency.txt в следующем формате:

ЕВРО (EUR)
Британский фунт (GBP)
Доллар США (USD)
Австралийский доллар (AUD)


person user1548465    schedule 25.07.2012    source источник
comment
Просто погуглите C++ HTML parser, и вы получите много полезных результатов. Также взгляните на этот другой вопрос.   -  person betabandido    schedule 25.07.2012
comment
Если это для одного из, подойдет простой скрипт sed/awk. Если вам придется делать это регулярно, используйте парсер XML/HTML.   -  person gastush    schedule 25.07.2012
comment
Я буду использовать libxml для его разбора.   -  person Deqing    schedule 26.07.2012


Ответы (1)


Используйте синтаксический анализатор XML/HTML (я не буду рекомендовать какие-либо конкретные, но их много). Менее общий подход — попытаться проанализировать это самостоятельно, например, используя регулярные выражения.

person Oleg2718281828    schedule 25.07.2012
comment
Вы не были здесь слишком долго, поэтому вы прощены за предложение «анализировать» HTML с использованием регулярного выражения, несмотря на ответ, данный об этом на stackoverflow.com/a/1732454/91757 ;-) - person Frerich Raabe; 25.07.2012
comment
@FrerichRaabe Я не предлагал анализировать общий HTML с использованием регулярных выражений, а только псевдоформат, представленный OP. Я указал на это (менее общее см. выше) - person Oleg2718281828; 25.07.2012