Autor Thema: HTML Seiten auslesen (Gelesen 2986 mal)

oson00 · « **am:** 12.12.06 - 12:50:27 »

Hallo,

ich habe eine Datenbank, in der ich einen Agenten erstellt habe, der von einem User per Aktionsbutton aufgerufen wird. Der Agent verbindet sich mit einer Internetseite und holt von dort die gesamte aufgerufenen Seite.

Ich lese die Daten aus dem Web per db.GetDocumentByURL

Wenn die Datenbank lokal liegt, funktioniert das ganze auch problemlos. Sobald die Datenbank auf dem Server installiert ist, funktioniert die Abfrage nur, wenn der Web Retriever Task auf dem Server gestartet ist.

Kann ich das ganze umgehen. Ich würde ungern den Server-Task starten, sondern lieber den Zugriff direkt vom Notes-Client ausführen lassen. Gibt es dafür eine Möglichkeit?

m3 · « **Antwort #1 am:** 12.12.06 - 12:55:37 »

1) Es gibt keine Internetseiten!

2) Du darfst halt die db von db.GetDocumentByURL nicht am Server öffnen, sondern immer nur lokal. Siehe auch die Designer-Hilfe:

Zitat

Instantiates a document in the database on which it is called and returns a NotesDocument object for it. This method is typically used for either the Server Web Navigator or Personal Web Navigator database, but can be called on any database object.

oson00 · « **Antwort #2 am:** 12.12.06 - 12:58:29 »

1) Wie heißt es korrekt? Webseite? HTML-Seite? Datei, die über den Internet-Dienst WWW bereitgestellt wird?

2) OK, das habe ich ja nun auch schon gemerkt. Kann ich das irgendwie umgehen. Ggf. einen anderen Befehl nutzen o.ä.?

m3 · « **Antwort #3 am:** 12.12.06 - 13:01:11 »

1) Webseite, web page, Dokument im World Wide Web

2) Nein.

Jenson · « **Antwort #4 am:** 12.12.06 - 14:53:28 »

beteilige mich nur vorsichtig an dieser Diskussion :-), aber ich glaube das sowas in einem Java-Agenten machbar ist, ohne dass da ein Task auf dem Server laufen muss, oder?

Wir haben da mal was zu gemacht, ist allerdings ne Weile her und die genaue Info wie das damals war habe ich nicht mehr im kopf.

Jenson

MadMetzger · « **Antwort #5 am:** 12.12.06 - 15:01:28 »

Mit einem Java Agenten kann man das machen, ich habe da in einem Buch mal ein Programmierbeispiel zu gelesen. Das Buch heißt "Java unter Lotus Domino" von Thomas Ekert. Ich weiß aber nicht, ob es rechtens ist, diesen Code hier einfach abzutippen.

Aber zum Prinzip funktioniert das per HttpUrlConnection, die dann einen InputStream zurückliefert, den man als String auslesen kann.

tower2 · « **Antwort #6 am:** 15.12.06 - 06:01:35 »

Hier ein Besipiel:

Die Parameter (url etc) werden dem Agenten per Dokument übergeben.

Java-Agent:

Code

import lotus.domino.*;
import java.io.*; 
import java.net.*;

public class JavaAgent extends AgentBase {

	public void NotesMain() {

		try {
			Session session = getSession();
			AgentContext agentContext = session.getAgentContext();
			Database db = agentContext.getCurrentDatabase();
			Agent agent = agentContext.getCurrentAgent();
			Document pdoc = db.getDocumentByID(agent.getParameterDocID());
			Document ndoc = db.createDocument();
			URL url=null;

			try {

			url = new URL(pdoc.getItemValueString("url"));

				}

				catch (Error e) {e.printStackTrace();

			}

    			// Create the Connection
    			URLConnection connection = url.openConnection ();
    			// Setup the connection parameters and request properties
    			connection.setDoOutput (false);
    			// Get the URL contents
    			String contentLine; String contents = "";
    			BufferedReader reader = new BufferedReader (new InputStreamReader
			(connection.getInputStream()));
    			while (null != (contentLine = reader.readLine ())) {contents += contentLine;
			}
 			//System.out.println(contents) ; 
			ndoc.replaceItemValue ("form", "DISK");
			ndoc.replaceItemValue ("disknr", pdoc.getItemValueString("disknr"));			
			ndoc.replaceItemValue ("url", pdoc.getItemValueString("url"));
    			ndoc.replaceItemValue ("disktext", contents);
  			ndoc.save(true,false);	 
		} catch(Exception e) {e.printStackTrace();
		}
	}
}

Autor Thema: HTML Seiten auslesen (Gelesen 2986 mal)

oson00

HTML Seiten auslesen

m3

Re: HTML Seiten auslesen

oson00

Re: HTML Seiten auslesen

m3

Re: HTML Seiten auslesen

Jenson

Re: HTML Seiten auslesen

MadMetzger

Re: HTML Seiten auslesen

tower2

Re: HTML Seiten auslesen