Анализ таблицы Java jsoup либо пропускает одну строку, либо выдает исключение индекса за пределами границ

Вчера я наткнулся на проблему с библиотекой jsoup.

public class Analyse {
    public static void main(String[] args) throws IOException, FileNotFoundException {

        try {
            PrintStream output = new PrintStream(new File("E://eBot1.txt"));
            System.setOut(output);
        }
        catch (FileNotFoundException fx) {
            System.out.println(fx);
        }

        for (int i = 1527; i < 1542; i++) {
            String url = "http://csgolive.eslproseries.de/matchs/view/" + i + "#stats-players";
            Document doc = Jsoup.connect(url).get();
            String MatchID = doc.select("h4").text();
            System.out.println("\n\n" + "Spiel: " + MatchID + "\n\n");
            for (Element table : doc.select("table[id=tablePlayers]")) {
                for (Element row : table.select("tr")) {
                    Elements tds2 = row.select("td:not([rowspan])");
                    int vsTwo = Integer.parseInt(tds2.get(13).text());
                    int vsThree = Integer.parseInt(tds2.get(14).text());
                    int vsFour = Integer.parseInt(tds2.get(15).text());
                    int vsFive = Integer.parseInt(tds2.get(16).text());
                    int fourKills = Integer.parseInt(tds2.get(20).text());
                    int fiveKills = Integer.parseInt(tds2.get(21).text());
                    if (vsTwo > 0) {
                        System.out.println("Team: " + tds2.get(0).text() + " Player: " + tds2.get(1).text() + " 1v2 Clutch: " + tds2.get(13).text());
                    }
                    if (vsThree > 0) {
                        System.out.println("Team: " + tds2.get(0).text() + " Player: " + tds2.get(1).text() + " 1v3 Clutch: " + tds2.get(14).text());
                    }
                    if (vsFour > 0) {
                        System.out.println("Team: " + tds2.get(0).text() + " Player: " + tds2.get(1).text() + " 1v4 Clutch: " + tds2.get(15).text());
                    }
                    if (vsFive > 0) {
                        System.out.println("Team: " + tds2.get(0).text() + " Player: " + tds2.get(1).text() + " 1v5 Clutch: " + tds2.get(16).text());
                    }
                    if (fourKills > 0) {
                        System.out.println("Team: " + tds2.get(0).text() + " Player: " + tds2.get(1).text() + " 4 Kills: " + tds2.get(20).text());
                    }
                    if (fiveKills > 0) {
                        System.out.println("Team: " + tds2.get(0).text() + " Player: " + tds2.get(1).text() + " 5 Kills: " + tds2.get(21).text());
                    }
                    else {
                    }
                }
            }
        }
    }
}

Итак, в основном, я хочу проанализировать таблицу из этого (http://csgolive.eslproseries.de/matchs/view/1529#stats-players). В этом URL-адресе matchID (в данном случае 1529) должен определяться циклом for. Это отлично работает, как и оператор jsoup.connect. Итак, я получил html-код с веб-сайта. Теперь я хочу отфильтровать псевдонимы с подходящей командой из таблицы. Команда должна быть

for (Element row : table.select("tr"));

Это, хотя и дает мне следующую ошибку:

Exception in thread "main" java.lang.IndexOutOfBoundsException: Index: 13, Size: 0
    at java.util.ArrayList.rangeCheck(Unknown Source)
    at java.util.ArrayList.get(Unknown Source)
    at org.jsoup.select.Elements.get(Elements.java:544)
    at org.jsoup.Analyse.main(Analyse.java:42)

Я пробовал методы, чтобы избежать этого. Единственный рабочий метод - положить

for (Element row : table.select("tr:gt(0)"));

Это загружает только записи таблицы 2-10, поэтому я всегда пропускаю первую.

Итак, мой вопрос: есть ли способ не получать эту ошибку и по-прежнему получать все строки таблицы?

РЕДАКТИРОВАТЬ: я закодировал другую возможность, которая выявила истинную ошибку: первая строка должна быть проанализирована в tds2.get(13).text() .get(14). etc дает IndexOutOfBoundsException. Итак, первая строка явно пуста. Однако, когда я печатаю его на консоли, все нормально.

Решено:

Заменены

for (Element row : table.select("tr")) {

С

for (int f = 1; f < 11 ; f++) {

person jojA    schedule 26.02.2015    source источник


Ответы (1)


Есть ли заголовок в таблице, которую вы анализируете? Как будто в первой строке есть ячейки, а не это было бы ожидаемым поведением...

person Emily Crutcher    schedule 26.02.2015
comment
Эта таблица имеет заголовок и тело. Я закодировал другую возможность, которая выявила истинную ошибку: первая строка, которая должна быть проанализирована в tds2.get(13).text() .get(14). и т. д., дает IndexOutOfBoundsException. Итак, первая строка явно пуста. Однако, когда я печатаю его на консоли, все нормально. - person jojA; 26.02.2015
comment
Вы можете попробовать распечатать строку на консоли, чтобы увидеть, что происходит. то есть распечатать каждый tr с менее чем 15 tds. - person Emily Crutcher; 27.02.2015