]> code.delx.au - gnu-emacs/blobdiff - lisp/url/url-parse.el
(ido-enable-prefix): Improve previous doc fix.
[gnu-emacs] / lisp / url / url-parse.el
index 23837990b66020dbddc631327e1f355c747ce7c5..2e4fc8a9f2732f28eb7dcab4219ca5de77275361 100644 (file)
@@ -1,27 +1,31 @@
 ;;; url-parse.el --- Uniform Resource Locator parser
+
+;; Copyright (C) 1996, 1997, 1998, 1999, 2004,
+;;   2005, 2006 Free Software Foundation, Inc.
+
 ;; Keywords: comm, data, processes
 
-;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
-;;; Copyright (c) 1993 - 1996, 2004 by William M. Perry <wmperry@cs.indiana.edu>
-;;; Copyright (c) 1996 - 1999 Free Software Foundation, Inc.
-;;;
-;;; This file is part of GNU Emacs.
-;;;
-;;; GNU Emacs is free software; you can redistribute it and/or modify
-;;; it under the terms of the GNU General Public License as published by
-;;; the Free Software Foundation; either version 2, or (at your option)
-;;; any later version.
-;;;
-;;; GNU Emacs is distributed in the hope that it will be useful,
-;;; but WITHOUT ANY WARRANTY; without even the implied warranty of
-;;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
-;;; GNU General Public License for more details.
-;;;
-;;; You should have received a copy of the GNU General Public License
-;;; along with GNU Emacs; see the file COPYING.  If not, write to the
-;;; Free Software Foundation, Inc., 59 Temple Place - Suite 330,
-;;; Boston, MA 02111-1307, USA.
-;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
+;; This file is part of GNU Emacs.
+;;
+;; GNU Emacs is free software; you can redistribute it and/or modify
+;; it under the terms of the GNU General Public License as published by
+;; the Free Software Foundation; either version 2, or (at your option)
+;; any later version.
+;;
+;; GNU Emacs is distributed in the hope that it will be useful,
+;; but WITHOUT ANY WARRANTY; without even the implied warranty of
+;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+;; GNU General Public License for more details.
+;;
+;; You should have received a copy of the GNU General Public License
+;; along with GNU Emacs; see the file COPYING.  If not, write to the
+;; Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
+;; Boston, MA 02110-1301, USA.
+
+;;; Commentary:
+
+;;; Code:
+
 (require 'url-vars)
 
 (autoload 'url-scheme-get-property "url-methods")
 
 (defmacro url-set-full (urlobj val)
   `(aset ,urlobj 8 ,val))
-  
+
 ;;;###autoload
 (defun url-recreate-url (urlobj)
+  "Recreate a URL string from the parsed URLOBJ."
   (concat (url-type urlobj) ":" (if (url-host urlobj) "//" "")
          (if (url-user urlobj)
              (concat (url-user urlobj)
                   (not (equal (url-port urlobj)
                               (url-scheme-get-property (url-type urlobj) 'default-port))))
              (format ":%d" (url-port urlobj)))
-         (or (url-filename urlobj) "/")
+         (or (url-filename urlobj) "/")          
+         (url-recreate-url-attributes urlobj)
          (if (url-target urlobj)
-             (concat "#" (url-target urlobj)))
-         (if (url-attributes urlobj)
-             (concat ";"
-                     (mapconcat
-                      (function
-                       (lambda (x)
-                         (if (cdr x)
-                             (concat (car x) "=" (cdr x))
-                           (car x)))) (url-attributes urlobj) ";")))))
+             (concat "#" (url-target urlobj)))))
+
+(defun url-recreate-url-attributes (urlobj)
+  "Recreate the attributes of an URL string from the parsed URLOBJ."
+  (when (url-attributes urlobj)
+    (concat "?"
+           (mapconcat (lambda (x)
+                         (if (cdr x)
+                             (concat (car x) "=" (cdr x))
+                           (car x)))
+                       (url-attributes urlobj) ";"))))
 
 ;;;###autoload
 (defun url-generic-parse-url (url)
   "Return a vector of the parts of URL.
 Format is:
-\[proto username password hostname portnumber file reference attributes fullp\]"
+\[TYPE USER PASSWORD HOST PORT FILE TARGET ATTRIBUTES FULL\]"
+  ;; See RFC 3986.
   (cond
    ((null url)
     (make-vector 9 nil))
    ((or (not (string-match url-nonrelative-link url))
        (= ?/ (string-to-char url)))
+    ;; This isn't correct, as a relative URL can be a fragment link
+    ;; (e.g. "#foo") and many other things (see section 4.2).
+    ;; However, let's not fix something that isn't broken, especially
+    ;; when close to a release.
     (let ((retval (make-vector 9 nil)))
       (url-set-filename retval url)
       (url-set-full retval nil)
@@ -140,6 +153,8 @@ Format is:
        (insert url)
        (goto-char (point-min))
        (setq save-pos (point))
+
+       ;; 3.1. Scheme
        (if (not (looking-at "//"))
            (progn
              (skip-chars-forward "a-zA-Z+.\\-")
@@ -148,13 +163,13 @@ Format is:
              (skip-chars-forward ":")
              (setq save-pos (point))))
 
-       ;; We are doing a fully specified URL, with hostname and all
+       ;; 3.2. Authority
        (if (looking-at "//")
            (progn
              (setq full t)
              (forward-char 2)
              (setq save-pos (point))
-             (skip-chars-forward "^/")
+             (skip-chars-forward "^/\\?#")
              (setq host (buffer-substring save-pos (point)))
              (if (string-match "^\\([^@]+\\)@" host)
                  (setq user (match-string 1 host)
@@ -162,8 +177,9 @@ Format is:
              (if (and user (string-match "\\([^:]+\\):\\(.*\\)" user))
                  (setq pass (match-string 2 user)
                        user (match-string 1 user)))
+             ;; This gives wrong results for IPv6 literal addresses.
              (if (string-match ":\\([0-9+]+\\)" host)
-                 (setq port (string-to-int (match-string 1 host))
+                 (setq port (string-to-number (match-string 1 host))
                        host (substring host 0 (match-beginning 0))))
              (if (string-match ":$" host)
                  (setq host (substring host 0 (match-beginning 0))))
@@ -173,33 +189,31 @@ Format is:
        (if (not port)
            (setq port (url-scheme-get-property prot 'default-port)))
 
-       ;; Gross hack to preserve ';' in data URLs
-
+       ;; 3.3. Path
        (setq save-pos (point))
+       (skip-chars-forward "^#?")
+       (setq file (buffer-substring save-pos (point)))
 
-       (if (string= "data" prot)
-           (goto-char (point-max))
-         ;; Now check for references
+       ;; 3.4. Query
+       (when (looking-at "\\?")
+         (forward-char 1)
+         (setq save-pos (point))
          (skip-chars-forward "^#")
-         (if (eobp)
-             nil
-           (delete-region
-            (point)
-            (progn
-              (skip-chars-forward "#")
-              (setq refs (buffer-substring (point) (point-max)))
-              (point-max))))
-         (goto-char save-pos)
-         (skip-chars-forward "^;")
-         (if (not (eobp))
-             (setq attr (url-parse-args (buffer-substring (point) (point-max)) t)
-                   attr (nreverse attr))))
+         ;; RFC 3986 specifies no general way of parsing the query
+         ;; string, but `url-parse-args' seems universal enough.
+         (setq attr (url-parse-args (buffer-substring save-pos (point)) t)
+               attr (nreverse attr)))
+
+       ;; 3.5. Fragment
+       (when (looking-at "#")
+         (forward-char 1)
+         (setq refs (buffer-substring (point) (point-max))))
 
-       (setq file (buffer-substring save-pos (point)))
        (if (and host (string-match "%[0-9][0-9]" host))
            (setq host (url-unhex-string host)))
        (vector prot user pass host port file refs attr full))))))
 
 (provide 'url-parse)
 
-;;; arch-tag: f338325f-71ab-4bee-93cc-78fb9a03d403
+;; arch-tag: f338325f-71ab-4bee-93cc-78fb9a03d403
+;;; url-parse.el ends here