Немного новичок здесь, работаю над личным проектом по очистке предложений моих школьных курсов в удобном для чтения табличном формате, но у меня проблемы с начальным этапом очистки данных с сайта.
Я только что добавил библиотеку JSoup в свой проект в eclipse, и теперь у меня возникают проблемы с инициализацией соединения при использовании документации для Jsoup.
В конце концов, моя цель — захватить имя/время/описание каждого класса, но сейчас я хочу просто захватить имя. HTML-код исходного веб-сайта выглядит следующим образом:
<td class='CourseNum'><img src='images/minus.gif' class='ICS3330 SW' onclick="toggledetails('CS3330')
Моя первая догадка заключалась в том, чтобы получитьElementsByTag(td), а затем запросить эти элементы для параметра onclick= или значения параметра «класс», очистив его, удалив начальное «I» и суффикс «SW», оставив позади имя «CS3330».
Теперь о фактической реализации:
Document doc = Jsoup.parse("UTF-8", "http://rabi.phys.virginia.edu/mySIS/CS2/page.php?Semester=1118&Type=Group&Group=CompSci").get();
Elements td = doc.getElementsByTag("td");
На данный момент я уже сталкиваюсь с проблемами (хотя я не сильно отклоняюсь от примеров, представленных в документации), и был бы признателен за некоторые рекомендации по тому, как заставить мой код работать!
редактировать: ПОНЯЛ! Спасибо вам всем!